当前位置:首頁 > 文章訊息 > 正文内容

短评:自然语言处理呼唤中国方案 云服务将从数字时代到智能时代

admin3年前 (2023-02-16)文章訊息230

  信息社会50人论坛执行主席 段永朝

  2023年2月16日

  美国OpenAI公司的ChatGPT甫一推出,即掀起全球浪潮。一时间各种惊艳测试令人目不暇接。ChatGPT在文档摘要、内容撰写、机器翻译、问题解答等领域的非凡表现,成为2023年度智能科技领域的抢眼新闻。

  ChatGPT是人工智能传统领域自然语言处理(NLP)的创新模式,基于GPT3.5语言模型、Transformer机器学习模型和无监督、半监督-微调预训练技术,通过巨量参数、海量文本数据的训练和学习,具备强大的文本生成能力。

  值得注意的是,ChatGPT的技术路线,有着鲜明的计算语言学演进的特征。理论计算语言学以语法解析和语义的形式理论研究为核心,通常以形式逻辑和符号方法为基础,包括自然语言的计算复杂性、应用上下文相关语法和线性有界图灵机模型等。

  1990年以来,计算语言学一直以统计方法为主,如神经网络和机器学习。神经网络方法因为缺乏统计可解释性受到一定程度的排斥。直到2015年前后,深度学习方法NLP的主要框架。这里重大的突破在于Transformer机器学习模型中使用的自注意力机制,即对输入数据的每一部分的重要性进行差异性加权。

  注意力模型的思想,缘于心理学家William James在130年前提出的“认知注意力”概念。James提出注意力的“聚光灯模型”将注意力分为两个阶段:一个阶段是注意力在视场中的均匀分布,这时候信息获得并行处理;另一个阶段是注意力的聚焦过程,这时候信息是串行处理的。

  1986年,Charles W. Eriksen & James D. St. James提出了变焦镜头模型,为注意力模型增加了环境变量的调节参数。

  ChatGPT所使用的自注意力机制,实际上就是这种变焦注意力处理过程在数据编码-解码过程中的延伸应用。传统自然语言处理过程中的编码-解码过程,采用通用计算框架,实质上是“注意力散光”过程。ChatGPT所采用的自注意力机制,在每个编码-解码过程中,都加入了自我注意机制,从而大大加强了预训练的效果。

  但是,需要看到的是,ChatGPT无论取得了何种成就,其语言模型的基本思想,依然是乔姆斯基的形式语法、瑞士语言学家索绪尔的“能指-所指”两分法。也就是说,以英语(屈折语言)为主要研究对象的主流自然语言处理技术,不可避免地带有乔姆斯基“存在先天语法结构假设”,以及索绪尔“符号、语音、对象可分离假设”这两个重要的假设。

  对中文语境的研究者、开发者和使用者来说,这两个假设在汉语环境下是否依然成立,是一个基础性问题。

  ChatGPT的火爆,其实更应该引发深层次的思考。著名语言学家萨丕尔、沃尔夫,在100多年前曾经指出“语言决定人的认知”;认知语言学的创始人莱考夫也说,在语言认知过程中,需要特别重视“隐喻”的认知价值(1980)。

  汉藏语系与印欧语系在语音、词汇、语形、语义、语法等层面有诸多不同。汉语的自然语言处理固然可以借鉴当代西方主流的语言模型、处理技术,但从根本上来说,汉语具备的音形义统一的特征需要给予特别的关注。这一点是呼唤中文自然语言处理技术创新发展的关键。

  最近百度的一则新闻引人关注。百度在多年潜心耕耘的基础上推出的“文心一言”大模型,一方面依靠计算技术、人工智能技术的大量积累,另一方面更立足海量中文文本、图形、数据的丰富环境,在中文环境的自然语言处理中独具特色,前景可期。百度核心战略业务之一的智能云未来势必也要接入文心一言,文心一言带来的庞大AI算力和数据需求将为百度智能云提供巨大的营收增量。ChatGPT和文心一言等将使云市场游戏规则发生根本改变,彻底改变云计算厂商的核心竞争力,适合跑AI的云将成为云计算市场领导者,云服务将从数字时代到智能时代。

  当然,这一领域的长足发展,还有赖于语言学家、心理学家、人类学家和计算机科学家的深度合作与创新。

“短评:自然语言处理呼唤中国方案 云服务将从数字时代到智能时代” 的相关文章

{易七百家樂}(三亚旅游攻略自由行三亚自由行旅游攻)

{易七百家樂}(三亚旅游攻略自由行三亚自由行旅游攻)

1大东海旅游区 大东海是三亚市内的公共沙滩之一,大东海因为交通方便,海平面广阔,海水干净,因此很多人来这边晒太阳和玩海值得一提的是,海滩上的外国人也是一道靓丽的风景线,听说以前大东海全部都是外国人,而...

Vanguard宣布退出 净零金融联盟遭遇迄今最大背叛

  Vanguard Group Inc.将退出全球最大的气候金融联盟。随着美国共和党人加大力度,威胁被认为对化石燃料行业有敌意的公司,该联盟遭遇了迄今最大的背叛。   Vanguard周三在声明中表...

2023年宝马在华纯电产品将增至11款 高乐:我们对中国市场的长期发展充满信心

2023年宝马在华纯电产品将增至11款 高乐:我们对中国市场的长期发展充满信心

  每经记者 裴健如    每经编辑 孙磊   12月8日,《每日经济新闻》记者获悉,2023年,宝马集团将在全品牌、全车系掀起新的电动攻势,为中国市场客户呈现11款纯电动产品。自2023年起,宝马还...

交个朋友谋局“新朋友”

交个朋友谋局“新朋友”

  来源:北京商报   锤子科技CEO罗永浩6月“隐退”时外界就在猜测,交个朋友下一个名牌主播是谁,现在有了答案:脱口秀演员李诞。12月8日,交个朋友相关人士告诉北京商报记者,“最近已签下李诞,开设李...

{易七娛樂城}(广东4a景区排名最新)

{易七娛樂城}(广东4a景区排名最新)

本篇文章给大家谈谈{易七現金網},以及广东4a景区排名最新对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 本文目录一览: 1、广东必去十大景点排名 2、广东省aaaaa景区排名 3、广...

陕西设置2.2万张定点医院床位应对新冠,并加快提标改造ICU

  12月9日15时,陕西省政府新闻办举办陕西省新冠肺炎疫情防控工作第五十场新闻发布会,陕西省卫健委二级巡视员于春富介绍了目前陕西省应对疫情形势变化的医疗救治工作。   于春富说:“国家发布进一步优化...