跳至主要内容

CSOFT白皮书:AI能否破解人类语言的奥秘?

近年来,由于在计算能力和存储方面的支持技术大大提高,人工智能的发展也受到了诸多关注。人工智能(AI)本身其实并不是一个新的概念,互联网的爆炸式增长及其产生的大量数据也起了重要作用,因为人工智能的发展在很大程度上依赖于输入数据的数量和质量。
市场研究公司CB Insights发布的人工智能研究报告显示,2017年全球人工智能创业公司共获得投资152亿美元,同比增长141%。其中,48%的资金流向中国,38%流向了美国。2017年,有1100家新的人工智能创业公司成立,人工智能正出现在各类商业模式之中。据市场分析机构Gartner预测,到2020年时,云服务市场——人工智能和数据管理的一个重要方面,规模将达到3830亿美元。
虽然人工智能引发了许多关于设计和道德方面的讨论,但它已经被看作是一种新的生产要素,将对未来的全球秩序产生深远的影响,而关于人工智能的研究已成为一些大国优先考虑的发展战略。虽然有些企业已经在应用程序和服务领域实现了复杂的人工智能应用,但距离人工智能真正实现与人类进行有意义的交流还相差很远。
在本地化、市场营销和翻译公司中,人工智能语言技术的运用在很大程度上取决于人工智能是否可以使用人类语言进行连贯地交流,其核心是对自然语言的处理,即对人类语言进行智能分析、提取要点,然后快速响应。

基于AI的语言工具
IBM Watson
IBM Watson是一个通过自然语言处理和机器学习,从非结构化数据中揭示洞察的技术平台。Watson Tone Analyzer可以理解文字信息并分析其中想要表达的语气,它可以辨识出情感,如愉快、害怕、愤怒等,还可以从文字中识别出一个人的社交风格和写作风格。这些剖析的结果可用于个人通信、商务沟通、品牌服务、市场营销、公关管理以及自动联络中心管理等。
Textio
Textio专门做特定情境下词汇和语言分析,它拥有强大的自然语言处理能力,除了能分析语言模式外,还能理解手写笔迹的细微差异。Textio主要应用于人才招募领域的招聘信息,作为人工智能文书检验平台,这款产品在招聘广告发布之前通过文本分析技术帮助企业预估其文案成功的可能性。Twitter、Microsoft、Starbucks等多家企业都使用Textio制作招聘文案。
Grammarly
Grammarly 是2010年推出的一款语法检查应用,使用机器学习算法为690万日常用户提供服务。Grammarly 功能强大,既能为初级用户提供词语拼写检查、同义词推荐等 5 大语法检查,又能为专业用户提供文章类型预判、原创性检查、单词推荐、以及文章校对等服务。
Grammarly 适合使用人群非常广泛,比如像经常从事英文编写、创作或是正在准备雅思、托福准备出国,亦或是在国内生活工作的朋友都可以把他当做提高英文写作能力的助手。
Atomic Reach
Atomic Reach公司发布了名为Atomic的人工智能系统,该系统基于人工智能神经网络,能够深度理解23种语言,除了为文章检查拼写和语法的错误,还能够在深入分析文章后提供写作相关的建议。
Atomic人工智能平台可以帮助市场营销人员创作质量更高的文本内容,并且通过查看不同读者对某一特定文本的互动效果来收集数据,从而帮助用户在适当的时间面向适当的受众发布内容。

神经机器翻译的最新进展
Facebook
以往机器翻译的进步,主要归功于大规模平行语料库(large-scale parallel corpora)的可用性。而Facebook AI Research(FAIR)团队提出的“基于短语和神经的无监督机器翻译”模型,可在没有任何平行数据的情况下进行翻译。
在机器翻译中使用神经网络的最大问题是,它需要两种语言的句子对数据集。它适用于英语和法语等被广泛使用的语言,而对于其他语言的句子对则不适用。因此,对于那些低资源的语言来说,机器翻译中的深度学习能力就尤为重要。
Amazon
Amazon Research在其发表的两篇论文《A Neural Interlingua for Multilingual Machine Translation》和《Fast Lexically Constrained Decoding with Dynamic Beam Allocation for Neural Machine Translation》中,提出了通过zero-shot翻译探索一种“真正的通用语言”模型,以及针对特定术语实现一致NMT的方法。
Google
Google Brain发表的关于神经机器翻译最新进展的论文《The Best of Both Worlds: Combining Recent Advances in Neural Machine Translation》,为其内部研发的最新NMT模型奠定了基础,该模型结合了循环神经网络(RNN)、卷积神经网络(CNN),以及一种自我聚焦机制的变形。
结论
人工智能技术近几年取得了长足的发展,也逐渐被应用到了越来越多的领域。人工智能处理人类语言大概有三种方法:即基于规则的机器翻译、基于实例的机器翻译和基于统计的翻译方法。但是,世界上的语言几千种,其中绝大多数语言之间都没有足够语料,因此,未来还要在无需语料库的机器翻译方面进行更多探索。
先进的自然语言处理技术要想在创建和理解内容方面达到人类的水平,首先需要深入研究人类大脑是如何工作的,而这个领域即使最好的神经科学家也感到困难。一些人工智能领域的科学家正在研究如何让机器真正像人一样思考、像人一样处理语言。虽然AlphaGo克服了“本能”的因素,击败了世界冠军围棋选手李世石,但自然语言涉及语义、语境、用法等方面的考虑,即使在人类中有时也无法达成共识。
在当前技术下,虽然机器翻译的质量明显提升,误差也不断降低,机器将完成未来大部分的简单翻译需求,但对于那些细腻、多元、充满人文特质的复杂沟通以及专业化翻译,人工智能究竟能不能实现,还将取决于数学、语言学、计算机科学、神经认知科学等很多方向的进展。
CSOFT华也国际
华也国际是全球领先的本地化和全球化服务供应商,为开拓海外市场的企业所面临的跨语言、跨文化沟通问题与挑战提供专家级解决方案。华也国际按需定制和实时人工翻译技术打破了传统的翻译行业,帮助客户加速企业在国际市场的迅速增长。华也国际拥有一支国际化团队,曾获得IDC最具创新力企业等众多国际奖项。华也国际CEO葉雪泥曾被《财富》杂志评选为“全球十大最具影响力女企业家”,还被CNN Money评为“全球36名最具颠覆性的技术变革者”。

评论

此博客中的热门博文

【反邪 | 柳州:融安县东起乡扶贫能手勇当反邪先锋】(龙政光)#我为反邪教代言##柳州反邪#在抗击新型冠状病毒感染的肺炎疫情的战疫中,融安县东起乡驻村工作队的队员们一直战斗在疫情防控一线,他们既是扶贫能手又是反邪先锋。疫情期间他们入户确保贫困户生活能得到保障、进行外来人口摸排、对重点对象进行监测、进行产业政策宣传、动员复工复产确保脱贫成果。同时向村民普及反邪教知识,进行防疫知识宣传并发放反邪教宣传手册,告诉他们什么是邪教,邪教的危害,要做到认知邪教,拒绝邪教!提醒村民防范邪教,防止邪教组织在疫情紧张时期拉拢蛊惑群众,如有外来人员宣传邪教时马上打110报警。反邪教工作的持续开展确保了东起乡的稳定安宁。@广西反邪教 @柳州政法

【反邪 | 柳州:融安县东起乡扶贫能手勇当反邪先锋】(龙政光)#我为 反邪教 代言##柳州反邪#在抗击新型冠状病毒感染的肺炎疫情的战疫中,融安县东起乡驻村工作队的队员们一直战斗在疫情防控一线,他们既是扶贫能手又是反邪先锋。疫情期间他们入户确保贫困户生活能得到保障、进行外来人口摸排、对重点对象进行监测、进行产业政策宣传、动员复工复产确保脱贫成果。同时向村民普及 反邪教 知识,进行防疫知识宣传并发放反 邪教 宣传手册,告诉他们什么是 邪教 , 邪教 的危害,要做到认知 邪教 ,拒绝 邪教 !提醒村民防范 邪教 ,防止 邪教 组织在疫情紧张时期拉拢蛊惑群众,如有外来人员宣传 邪教 时马上打110报警。 反邪教 工作的持续开展确保了东起乡的稳定安宁。@广西 反邪教 @柳州政法

看《银翼杀手2049》前,先看看原著小说吧

电影名气这么大,原著小说也不简单,来自美国科幻界大师菲利普·迪克的《仿生人会梦见电子羊吗?》 菲利普·迪克精装套系 (美)菲利普·迪克 著 许东华 等译 译林出版社 2017年10月   韩松   1982年,雷德利·斯科特导演的电影《银翼杀手》上映,成为电影史上的科幻经典。时至今日,《银翼杀手》的魅力丝毫未减,其影响之深远已经超越了电影。35年后,电影续集《银翼杀手2049》10月27日在国内上映。电影名气这么大,原著小说也不简单,来自美国科幻界大师菲利普·迪克的《仿生人会梦见电子羊吗?》,这本有着奇怪名字的小说,是菲利普·迪克最负盛名的作品,也是各大科幻书单的必读书目,电影《银翼杀手》和《银翼杀手2049》的人物角色和灵感设想就是发源于此。   菲利普·迪克精装套系包括《仿生人会梦见电子羊吗?》《高堡奇人》《少数派报告》《尤比克》《流吧!我的眼泪》五部科幻小说。作品集中探讨“何为真实”以及“个体身份建构”,盛名经久不衰,有多部作品被改编成电影,包括《银翼杀手》《少数派报告》《全面回忆》等。以其名字命名的菲利普·K·迪克奖是美国科幻界的主要奖项之一。    生前潦倒,死后盛名   关于迪克的生平,如今人们介绍得已经很多了,大致是这么一些情况:   他生于1928年,卒于1982年,只活了54岁。他作品中的不少人物,差不多也都命不长。   他活着时,几乎就是个“撸瑟”,也就是失败者。他有一个双胞胎妹妹,但出生后五周就死了。迪克认为是母亲照料不周,因此恨他妈,家庭关系不好。而父亲在迪克四岁时,也抛家而去。迪克结过五次婚,都离了。成年迪克靠安非他命活着,还吸毒,经常陷入神经错乱中。他有严重的焦虑症,不能与人正常交往。他还患上了妄想症,认为自己被联邦调查局和中央情报局监视。他有广场恐惧症,连在公众面前吃东西,都感到困难。他还患上了抑郁症,曾尝试自杀。他在70年代后,沉湎于超自然,并一度称获得天启。他只短暂地上过一年大学,读哲学,在加大伯克利分校。他基本上是自学成才。他一生大部分时间居住在加利福尼亚。   他是一位多产的作家,从1952年开始写作,到1982年去世,创作了整整30年,写了44部长篇小说,以及120多篇中短篇小说。他常常为挣稿费养活自己而拼命写。他没有其他工作。他的个人经济状况很窘迫,在50年代,一度连图书馆借书...

糖尿病患者按这10种方法吃主食,升血糖慢,餐后血糖达标更有保障

主食的主要成分是碳水化合物,简称“糖类”,因为糖类会产生热量,所以吃了以后,就会升高血糖。但是,从古到今,人类生存,一日三餐,又离不开主食。 主食吃了升血糖,不吃又不行,那么,怎样才能吃主食让血糖升得慢一些呢?本文就告诉您10个方法。 1.吃粗粮比吃细粮升血糖慢 临床工作人员常会建议糖尿病患者适当吃点粗粮,就是因为粗粮中含有丰富的膳食纤维,膳食纤维是一种多糖类物质,不会被人体吸收,也不产生热量,所以,吃了不会明显升高血糖。 但是,有些患者就天天吃粗粮,甚至一天三餐,一次吃两三个馒头,那就失去了吃粗粮的意义。 粗粮中的膳食纤维掺合在细粮中,可起到延缓血糖升高的作用,吃多了,粗粮中的非膳食纤维成分同样会产生更多的热量。 所以,建议 糖尿病患者吃粗粮的时候,只是比同等量的细粮多吃几口而已,并不是吃得越多越好。最好粗粮细粮搭配着吃,交替着吃。 2.吃杂粮主食比吃纯粮主食升血糖慢 杂粮馒头指两种或两种以上的粮食磨成面粉做成的馒头,如将荞麦面、小麦面、玉米面、豆面等,其中的两种或三种,甚至四种,或者更多的面粉掺合起来做成的馒头,比单纯用一种面粉做成的馒头营养丰富,还升血糖慢。 如果 在杂粮馒头中加入部分菜叶,如芹菜叶等,升血糖更慢 。 杂米饭也是这个道理,将 大米、小米、豆类或其他米类中的两种或两种以上的米混杂在一起,蒸米饭,要比单纯蒸白米饭升血糖慢。 若在 蒸杂粮米饭的时候加入几块胡萝卜、南瓜等,还能补充一些维生素 等。 3.吃干饭比吃稀饭升血糖慢 现在很多患者知道吃大米稀饭升血糖快。这是因为稀饭经过反复熬煮、糊化,易于吸收,能够迅速升高血糖。 所以,有的患者不喝大米稀饭改喝小米稀饭, 小米稀饭同样能够较快升高血糖 。这不是大米和小米本身的原因,而是烹饪方式的结果。 任何一种米,只要熬烂,做成稀饭,都比干饭升血糖快。 为什么有的人喝麦片,升血糖快;有的人喝麦片,血糖升高不明显。升血糖慢的,是用开水冲了以后,及时食用;升血糖快的,也是缘于长时间的焖煮,性质变成稀饭了。 4.吃硬的比吃软的升血糖慢 同样是主食,如果选择 火烧、煎饼、窝头、烙饼 等相对干硬的的食物,需要较长时间的咀嚼、消化和吸收,就要比柔软的发糕、疙瘩汤、煮烂的面条等升血糖慢。 俗话说,有的人在人际交往方面,吃软不吃硬,糖尿病患者吃主食时...