■出售外链〓提升排名┿【QQ:1012189958】 车辆保险 交强险 二手车 广州二手车 网站建设 app开发 网站制作 一号站 捕鱼游戏 澳门百家乐 万达平台 1号站平台 1号站平台 1号站平台 1号站 1号站 一号站/a> 拉菲2 拉菲2 拉菲2 万达平台 万达娱乐 万达平台 万达平台 万达平台 万达平台 万达平台 万达平台 万达娱乐 东森平台 东森平台 东森娱乐 娱乐天地 娱乐天地 娱乐天地 金沙棋牌 捕鱼技巧 捕鱼技巧 捕鱼技巧 美高梅网址 牛牛 捕鱼 新葡京官网 真人百家乐 美高梅官网 美高梅官网 美高梅官网 新葡京官网 金沙网址 澳门美高梅官网 必赢彩票网 葡京赌场 葡京赌场 澳门新葡京 澳门新葡京 大发888 大发888 大发888 大发888 大发888 必赢国际 巴黎人娱乐城 博狗 澳门永利赌场 永利棋牌 永利棋牌 澳门新濠天地官网 澳门新濠天地官网 金蟾捕鱼 真钱牛牛 澳门新濠天地 捕鱼平台 捕鱼平台 365bet官网 真钱斗地主游戏 网上真钱扎金花 山西快乐十分 线上赌博平台 基金开户 帮考网 草根站长 拉菲娱乐 澳门百家乐 澳门百家乐 网贷帮 广州交通 球探比分 凤凰平台 澳门网上赌博 电玩box 港股 港股 A股行情 黄金价格 外汇开户 域名 金蟾捕鱼 1号站平台 888真人开户 888真人平台 一号站 pc蛋蛋信誉群 一号站 娱乐平台 拉菲娱乐平台 皇冠比分 新葡京 皇冠娱乐网 bt365娱乐官网 亿万先生 吉祥坊wellbet ca88亚洲城 千亿国际 龙8国际 亚虎国际 188bet ca88亚洲城 皇冠体育平台 现金娱乐平台 新葡京娱乐场 真钱21点 真钱21点 真钱牛牛 湖北11选5 真钱捕鱼 优德娱乐 申博 二八杠 最新全讯网 百家乐开户网 百家乐开户网 百家乐开户网 百家乐开户网 免费注册送彩金 博狗注册 皇冠备用 外围赌球 新2网址 888真人网址 澳门金沙 网上牌九 明升88 皇冠开户网 金鹰娱乐 现金炸金花 娱乐天地 娱乐天地 葡京酒店 真钱棋牌 体育开户 e世博官方网站 威尼斯人开户 澳门黄金城 澳门赌球 澳门游戏 真钱牛牛 二八杠玩法 二八杠技术 e世博注册 香港赌场 斗牛技巧 皇冠赌场线上娱乐 金沙娱乐 新葡京娱乐场 乐虎国际娱乐 棋牌 杏彩 澳门威尼斯人 澳门美高梅 伟德亚洲 bet365体育投注 威尼斯人 凤凰娱乐 凤凰娱乐 万达娱乐 拉菲娱乐 万达娱乐 万达娱乐 杏彩平台 凤凰平台 凤凰平台 凤凰平台 娱乐天地 娱乐天地 娱乐天地 娱乐天地 葡京 时时彩 即时比分 即时比分 365体育投注 江苏快三 比分 比分 澳门巴黎人 赌博 街机游戏 足彩网 腾讯分分彩 排列3 澳门金沙 美高梅 赌博网 天下足球网 365备用网址 捕鱼达人3 赌博网 赌博网 大发体育 1956 东森娱乐 大发888赌场 大发888赌场 bbin bbin bbin 捕鱼达人2 凤凰娱乐 现金网 金沙娱乐 澳门百家乐 澳门百家乐 bbin 幸运7 幸运7 幸运7 幸运7 幸运7 幸运7 幸运7 幸运7 幸运7 幸运7 幸运7 万达娱乐 拉菲娱乐 江苏快三 1号站平台 葡京 金沙 凤凰娱乐 万达平台 新葡京 澳门金沙 电子游戏 新葡京 银河 电子游戏 杏彩娱乐 万达平台 BBIN 金蟾捕鱼 新葡京 杏彩网 蒙特卡罗 万达娱乐平台 澳门金沙 申博 申博 翡翠娱乐 赌博 娱乐天地 银河 老虎机 新濠天地 凤凰娱乐 娱乐天地 我爱旅游 万达娱乐 凤凰娱乐 电子游戏 我爱旅游 我爱旅游 我爱旅游 万达娱乐 1号站 畅博娱乐 万达娱乐 万达娱乐 万达娱乐

人工智能大数据公司「新译科技」完成5000万元

来源:网络整理 | 2017-10-30 17:13

原标题:36氪首发 | 人工智能大数据公司「新译科技」完成5000万元 Pre-A 轮融资,侧重人工智能文本领域 B 端、G 端业务

36氪近日获悉,人工智能大数据公司新译科技获得了5000万人民币 Pre-A 轮融资。本轮融资中厦门市美亚梧桐投资管理有限公司,凯泰资本与博将资本合作投资,原天使轮投资机构清华力合继续跟进。新译科技天使轮融资于2016年10月完成,截至目前 Pre-A 轮融资资金已全部到位。本轮融资引入的投资机构主要进行公司日后的资源整合和布局,资金主要用于市场拓展、高端人才引进、硬件资源的投入和研究院建设。

数据显示,2014年全球翻译行业市场规模大达到371.9亿美元,同比增长6.23%,预计2020年将达到530亿美元左右。2014年到2016年发生的大事,是以神经网络作为基础的神经网络机器翻译(NMT),开始在全面超越此前以统计模型为基础的统计机器翻译(SMT),并快速成为在线翻译系统的主流标配。

NMT 的基本思想,是以每一个句子作为独立的神经元,从而打破传统基于短语的翻译障碍。此外,NMT 跳过传统基于短语的机器翻译中间各种子 NLP 步骤(分词、词性标注、句法分析等),用深层的网络结构去直接学习拟合源语言到目标语言的概率,可以实现监督训练,不必完全依赖固定数据,这可以在专业领域等资料稀少的环节,获得更好的翻译结果 。

新译科技从事人工智能文本领域,侧重在机器翻译的研发和衍生品的开发。当前国际上主要有谷歌翻译、微软翻译,国内主要有有道和百度,最近也加入了阿里,腾讯等企业。做机翻的当前这些机构都是大品牌,具有大的流量,新译侧重 B 端和 G 端的落地和应用,产品定位不同,所以与这些大企业在产品定位和服务目标不同。

人工智能主要看三个方面,大数据、算力和算法。数据方面,新译科技投入资金完善数据量,另一方面协助 B 端用户构建内部数据,在部分客户允许的前提下,获取专有数据。算法上,新译采用 GPU/FPGA 等硬件,加之神经网络芯片和云计算。目前 GPU 训练速度接近1.5-2倍的速度快于开源框架 Theano、Tensorflow、Torch 的训练时间。在分布式集群训练环境下,3-5天的时间就可以训练一个千万句对的双语数据,翻译速度在836词/秒(GPU)。算法上则采用了深度学习等机器学习方式。

现在新译科技涵盖了包括爱沙尼亚语、保加利亚语、匈牙利语、土耳其语、意大利语、阿拉伯语、荷兰语、法语、越南语、日语、韩语、捷克语、葡语、德语、西班牙语、英文、俄语、中文等主流的37种语言,当前正在根据用户的需求不断更新上线。

据36氪了解到,新译科技自2015年起至今,从最初的规则统计混合模型,到现在的神经网络模型,主要更新了三版系统。为了检验公开线上的翻译效果(mt.newtranx.com),新译科技使用公开的联合国领域内数据(United Nations Parallel Corpus v1.0)( )以及 UM-Corpus( )做了评测。其中公开的 United Nations Parallel Corpus v1.0 为1990年到2014年的数据,新译科技选择了所有的外语到中文的双语数据(英中、法中、西班牙中、阿拉伯语中、俄语中文),另外补充了2015-2016年的联合国双语数据每个语言对大约30万句以及 UM-Corpus 的210万句英中双语数据。测试集合选择 United Nations Parallel Corpus v1.0 中的公开测试集合开发集。下图给出了以 BELU 值(国际上常用的一个机器翻译评测标准)作为评测指标的对比图。从图中可看出最新版系统翻译质量较上一版本基本都达到了2个BLEU值的提升,最高提升9个百分点。

图:新译科技新老版本NMT引擎对比

当前有一个共识就是,在一定数量的双语数据中,垂直领域的机器翻译要比通用的效果好。新译科技现有37个语种共计103亿句对,对公司现存的5.7亿句中英双语数据进行归类整理,划分出了25个领域。最终选择了新闻媒体、IT通讯、专利产权、金融财经、生物医学、法律合同,工程制造、机械工程、石油化工、旅游口语作为上线的主要领域。

之所以优先选择这几类领域,是因为机器翻译擅长是叙述性文本的表述和传达,对于创作性内容(诗歌,散文)并不完美。而这几个领域正好符合表述相对固定,容易被机器“理解”。