当前位置:首页>新闻 > IBM专家观点:从ChatGPT走红,谈企业需要什么样的人工智能

IBM专家观点:从ChatGPT走红,谈企业需要什么样的人工智能

ChatGPT火爆出圈

最近几周,AI业界最大的新闻无疑是ChatGPT横空出世,从而引发的业界震动。市场上有大量的评论文章,有把它描述成无所不能的,大有代替人类职业之势;也有提出担扰,某些顶级学术杂志和知名高校已经明确限制AI作者发表论文和科研成果。

出于好奇,笔者也试用了ChatGPT。整体感觉对于一般的开放性问题,ChatGPT生成的回答文法结构完整,语言风格自然,比之前的聊天机器人有明显的进步。内容的准确性和完整性,往往能超过正常交流时大多数人的“第一反应”,更像是经过了一番思考并整理后的结果,条理清晰,很有启发。但对于专业性问题,尤其是需要逻辑推理的知识,ChatGPT并没有像网上文章说的那么出色,经常“张冠李戴”或者形式上像模像样但内容上却不知所云。

为什么会这样呢?我们可以问一问ChatGPT自己。

“ChatGPT是由OpenAI公司开发的一款预训练语言模型,旨在生成人类可读的文本。它通过读取大量的文本数据,学习了如何生成与语言相关的内容,并在输入一段文本时生成一段有关的文本输出……”

ChatGPT中的GPT的全称是的“Generative Pre-trained Transformer -即生成性预训练变换模型“。借用一位名叫#硅谷学霸Jolin 的技术教育博主对GPT模型的浅显解释,她说,以ChatGPT为代表的”生成性AI”是一项技术突破,之前AI学习大多聚焦于观测、分类和分析内容,而生成性AI则不限于分析现有数据,它可以生成新内容,可以根据需要生成新的代码、诗歌、文章和艺术品。ChatGPT是专注于文本内容的生成性AI。所谓“预训练”是指该模型已经在某些有限的数据集上进行了训练,事实上,ChatGPT已经学习了2021年6月以前人类编写和发布在互联网上的海量信息,而且是通过“监督学习”和“人类反馈强化学习”这两种技术进行的学习。Transformer是一个非常底层的AI机器学习的算法架构,是一种深度神经网络。从GPT-1到今天的GPT-3.5都是采用Transformer架构,而GPT模型的进化有赖于底层硬件超级算力的效率提升,以支持AI对更多、更大数据集的训练和学习[i]。

也就是说,ChatGPT是通过海量(约45TB [ii] )语料训练而掌握了语法和语义结构的成熟的大型语言模型(Large Language Model, LLM),其特色是文本生成能力很强,产生的文字风格和内容很像之前的输入,即人类语言。由于训练语料涉及面广,所以ChatGPT对各行各业的信息都有涉猎,总能略知一二,有时甚至回答得头头是道。对某些专业领域,比如编程,甚至可以产生准确的代码并直接运行。然而,若仔细观察,这些代码往往都是解决特定的小任务,代码风格似曾相识。若要完成一个创新的算法,或者复杂问题的编程,ChatGPT就无能为力了。

总体而言,这类通过学习语料来生成文本的AI模型,都是在学习过去,其目标是模仿过去,生成出几可乱真的作品,并不是真正意义下的创造未来。ChatGPT也不例外。作为助手,对思考的广度往往有帮助,对思考的深度却不尽然。

从聊天到业务助手

ChatGPT让我们看到了大型语言模型的未来。然而,在企业应用中,为了创造业务价值,这类对话形式的应用(ChatBot)则更多用于对外的“客户服务”或对内的“业务助手”方面。这就对此类模型提出更高的要求——

第一, 准确性和专业性

企业往往要求回答准确且专业,如果对答案没有把握,回答“不知道”也好过生成一大段丰富而无用的文字。

ChatGPT是一种“开放领域系统”(Open-domain system),类似的还有Google的Bard,它们都需要海量的信息输入和长时间的训练,能应付所有领域的对话,回答内容相关度高,对答自知,语法自然。

而企业级的ChatBot是一种“封闭领域系统”(Close-domain system),往往不是需要一个乖巧的“百事通”,而是需要专业领域可靠的“知识助手”。它的训练语料是有限的,包含企业内部文档和资料、专业领域知识库、外部该领域的相关文章等等,大量的资料都是不公开的。ChatBot能回答的问题也限定在专业领域的场景语境中。不必面面俱到,但求简练、精准、专业。

第二,主动式对话

碰到提问模棱两可的时候,企业应用往往要求通过主动引导式对话,甚至反问的办法,迅速澄清意图。然后,再给出明确的答案。这一点ChatGPT目前尚未做到,当问题模糊时,回答也模糊,提问者发现后,换一种问法,或者在对话中缩小范围,可逐步得到想要的结果。整个过程中,ChatGPT每次都是被动回答。

第三,后台集成能力

ChatBot往往作为企业对话的渠道入口,在提供服务时需要和企业大量的后台系统集成。比如:在识别意图后可以从数据库或大数据平台中自动收集相关数据,并进行分析和推理,得到客户所需的明确答案;或者启动一条指令或一个后台流程,帮助客户完成相关操作。

IBM Watson服务企业级AI应用

OpenAI从2018年以来长期坚持研发大型语言模型,通过不断迭代,从最初的GPT-1到目前的GPT-3,且今年会发行GPT-4。目前,在开源社区找到GPT-3模型,也为企业开展此类研究提供了范本。

ChatGPT对企业的吸引力是毋庸置疑的,多数企业都有意愿拥有一个自己的ChatGPT。然而,当前ChatGPT采用最新的GPT-3.5模型,含有千亿级参数,一次训练就要花费数百万美元[iii]。大多数企业不具备如此大的算力,但如果为了获得对话模型,把企业内部数据都上传到网上,利用公有云训练也会有安全顾虑。所以,企业主导训练一个定制版ChatGPT,无论从财力还是合规方面都会有障碍。

IBM Watson,也就是IBM企业级的人工智能,经过十多年的发展,从研究到实验,至今已经发展成为一套可以在红帽 OpenShift上任意运行的AI能力,以产品化的方式提供给用户,帮助企业整合和分析混合环境下分散而复杂的企业数据,从而实现数据驱动的预测性决策、智能自动化和基于企业内外适时数据和洞察的安全策略与响应。

今天IBM Watson已经应用于全球四万多企业用户的业务场景当中,为具有不同水平AI技能的用户提供尖端的AI能力,无论是缺乏AI技能却想通过AI重获时间效率的商务及专业人士(例如人力资源、财务、网络安全管理人员等),还是具备一定AI技能并且正在大规模使用AI的数据科学家、IT专业人员等。

IBM Watson提供了许多不同的工具和服务,用于解决多种问题。它涵盖了语言处理,解释、回答和生成文本等多种功能,以帮助客户解决商业问题。同时,它也提供了语音识别、图像识别等其它功能,使之成为一个非常强大和全面的人工智能平台。

长期以来,IBM Watson面向企业级AI应用,特别为企业定制“业务助手”类的对话式应用。基本上,Watson有语音文字转换、意图识别、对话流设计、文本分析、知识整理、情感分析等功能。使得Watson可以在通用的语言模型上叠加专业领域知识,并有意识地设计和引导对话方向。

Watson通过后台的机器学习、自然语言处理、文本生成、语音识别与合成、对话系统、知识图谱技术,可以分解文本结构,精准定位观点、事实、论据、逻辑关系等,早在数年前,采用IBM Watson技术的IBM人工智能辩手(Project Debater)[iv]就曾以它的机智幽默和高情商而惊艳业界,它可以针对任何一个预设话题,比如“国家应该为每个人提供基本收入”,临时选择正方或反方,与人类的辩论冠军选手进行对辩。今天的ChatGPT也可以达到这个效果。应该承认,其通用语言模型和文本生成技术所呈现的体验感受甚至可以超过Watson,令人惊艳,其开放的用户界面更是让大众能够亲身体验这种惊艳,然而Watson的专业性、可设计性、集成性则更适合企业级的业务定位。IBM把这种普适性的大型基础模型称为基础模型(Foundation model)[v],它利用迁移学习(Transfer learning)经过少量的专业训练,就能进入一个知识领域,并且得到新的启发,这一点非常像人类的学习过程,有广阔的应用前景,也是IBM今后研究的重点。

我设想,对于企业已有的Watson对话模型,也可以利用ChatGPT得到增强。可以是协同模式:当发现是专业领域的封闭式问题,可用原有Watson模型回答,当发现是开放式问题,可用ChatGPT回答。也可以通过竞争模式:一次生成多个答案,由人类做裁判,相互学习,共同提高。

总言之,ChatGPT将人机对话的体验提高了一个档次,利用强大的搜索和知识整理的能力,在问题回答的广度上往往很有启发,但深度不足。目前只能学习(Learn)人类语言和知识,还做不到思考(Think)推理,也难以驾驭高度创新和深度思考的任务。我认为,对于企业级的应用,融合ChatGPT与IBM Watson之所长,不乏为快速高效地应用AI 提升体验、创造价值之选。

( 作者:陈宇翔,IBM杰出工程师、大中华区客户成功架构师、大中华区金融行业首席架构师 )

本文作者简介:

陈宇翔先生现任IBM大中华区客户成功架构师,他是IBM杰出工程师(Distinguish Engineer), 也是IBM大中华区金融行业首席架构师。在近25年的IT 从业经历中,他主持了许多大型项目的解决方案设计和IT 架构设计,熟悉银行领域相关业务,是行业高级顾问。陈宇翔先生也是软件和技术专家,长期致力于软件推广工作。同时拥有IBM 高级工程师和资深架构师认证。

陈宇翔先生长期致力于“人工智能、云计算、物联网、量子计算”的技术推广,结合金融行业创新应用,是金融行业创新解决方案设计的领导者和实践者。

关于 IBM

IBM 是全球领先的混合云、人工智能及企业服务提供商,帮助超过 175 个国家和地区的客户,从其拥有的数据中获取商业洞察,简化业务流程,降低成本,并获得行业竞争优势。金融服务、电信和医疗健康等关键基础设施领域的超过 4000 家政府和企业实体依靠 IBM 混合云平台和红帽 OpenShift 快速、高效、安全地实现数字化转型。IBM 在人工智能、量子计算、行业云解决方案和企业服务方面的突破性创新为我们的客户提供了开放和灵活的选择。对企业诚信、透明治理、社会责任、包容文化和服务精神的长期承诺是 IBM 业务发展的基石。了解更多信息,请访问:https://www.ibm.com/cn-zh

参考资料

[1] OpenAI公司在GitHub上开源的GPT-3模型, https://github.com/openai/gpt-3 

[2] IBM致力于基础模型研究

https://research.ibm.com/blog/what-are-foundation-models

https://research.ibm.com/blog/molecular-transformer-discovery

[i] 至顶网2023年2月8日文章:《助力AI科研,IBM研究院打造Vela超级计算机》链接:https://server.zhiding.cn/server/2023/0208/3147388.shtml

[ii] 东吴证券研报分析认为,ChatGPT的模型经历从GPT-1到GPT-3的升级,优化主要来自算力增加。GPT-1、GPT-2和GPT-3在算法模型并没有太大改变,但参数量从1.17亿增加到1750亿,预训练数据量从5GB增加到45TB,其中GPT-3训练一次的费用是460万美元,总训练成本达1200万美元。虽然训练数据量和算力大幅增加使GPT-3有显著优化,但高额投入也使其只能走B端变现。信息源:第一财经2022年12月7日报道:《拳打谷歌ChatGPT火出圈!投资人称更需警惕投资泡沫化跟风》。信息源:https://www.yicai.com/news/101616572.html

[iii] 东吴证券研报分析认为,ChatGPT的模型经历从GPT-1到GPT-3的升级,优化主要来自算力增加。GPT-1、GPT-2和GPT-3在算法模型并没有太大改变,但参数量从1.17亿增加到1750亿,预训练数据量从5GB增加到45TB,其中GPT-3训练一次的费用是460万美元,总训练成本达1200万美元。虽然训练数据量和算力大幅增加使GPT-3有显著优化,但高额投入也使其只能走B端变现。信息源:第一财经2022年12月7日报道:《拳打谷歌ChatGPT火出圈!投资人称更需警惕投资泡沫化跟风》,https://www.yicai.com/news/101616572.html

[iv] 新浪新闻 2019年5月20日文章:《AI下棋还在喧嚣,AI辩论早已启航》链接:http://client.sina.com.cn/news/2019-05-20/doc-ihvhiqax9982923.shtml

[v] 至顶网2023年2月14日文章《IBM运用基础模型加生成式AI,展示开创性AI研究成果》链接: https://www.sohu.com/a/640755030_114765

为您推荐
  • 广西一新娘,因“长得太美”而火出圈,网友:山窝里的金凤凰!
    2024-03-15
    在广西某个幽静的村落,一场盛大的婚礼成为了村民们茶余饭后的热议焦点。婚礼之所以如此引人瞩目,不仅因为它洋溢着浪漫与温馨的气息,更因为新娘那令人惊艳的容貌,仿佛一位踏月而来的仙女,让在场的每一个人都为之倾倒。新娘名为小梅,是一位土生土长的广西姑娘。她那双清澈明亮的大眼睛,宛如山间的一泓清泉,灵动而深邃。她那弯弯的眉毛,如同柳叶一般婀娜多姿,映衬着白皙如玉的肌肤,更显清丽脱俗。当她笑起来时,那灿烂的笑
  • 接连签约!南通将新增一批打卡地
    2024-03-15
    为全面落实全市“重大项目攻坚突破年”部署要求,2024年开年以来,全市文广旅系统主动作为、强势开局,推动文旅市场加快复苏,重大文旅项目如“春花绽放”般签约。截至目前,新签约文旅项目7个,总投资额24亿元。项目详情滨海酒店项目签约时间:2024年1月签约地点:启东市投资金额:10亿元项目介绍:滨海高端度假酒店项目位于启东市江海澜湾旅游度假区,由上海长甲集团投资建设,总投资10亿元,占地约370亩,将打造集高端度假酒店
  • 四川五日游旅游路线,四川游哪些美食,来四川如何规划行程
    2024-03-15
    四川,简称"川"或"蜀",省会成都,位于中国大陆西南腹地,自古就有"天府之国"之美誉,是中国西部门户,大熊猫故乡。四川今与重庆、贵州、云南、西藏、青海、甘肃、陕西诸省市交界。四川东部为川东平行岭谷和川中丘陵,中部为成都平原,西部为川西高原。这次出游是朋友推荐的一位四川当地旅行规划师小雅安排的,没有任何自费项目!从接站到住宿、交通、吃饭、门票等都是小雅安排,十分省心。真心推荐
  • 夫妻关系如何维持?寻找专属于你的婚姻幸福之路
    2024-03-15
    在《社会心理学》中提到了两个在现代生活中似乎无可辩驳的事实,一是亲密而持久的婚姻关系是幸福生活的标志;二是亲密而持久的婚姻关系正在减少。由此,人们必须付出努力才能防止爱情的衰退,这就像哈维说的:“‘用心照顾’我们的亲密关系能够使我们获得更长久的满足”,那么怎样才算是对亲密关系的“用心照顾”,也就是说我们应该如何维持夫妻关系,对此,同样在《社会心理学》中给出了一些建议:这些建议虽然有效,但又太过笼统
  • “微笑型抑郁症”患者突然自杀,亲朋好友无比震惊!这类悲剧其实可以预防
    2024-03-15
    我们写过不少关于“微笑型抑郁症”的文章。比如去年7月,一代天后李玟自杀身亡,几乎震惊了所有人!在大众心目中,她一直阳光、热情、爱笑,网友完全没想到她会自杀。她的离世,令不少人开始了解“微笑型抑郁症”。
  • 吃“裸碳水”升糖快,不妨给它加层衣服
    2024-03-15
    你是否听说过“裸碳水”?它是由简单碳水化合物组成的食物,不含脂肪、蛋白或纤维,比如加工食品、糖果、白米饭及含糖汽水等。与全谷物豆类等复合碳水相比,它极易消化并导致血糖飙升,易导致肥胖、二型糖尿病或心脏病。Verywell网站发文称,目前有很多减肥策略要求低碳水,这会走入另一个极端。无论是裸碳水或是复合碳水,都会在体内转化成葡萄糖,这是大脑最青睐的热量来源,对大脑活动以及人体功能非常重要。来源 / unsplash不
  • 天津男篮主场胜四川 李荣培高难度跳投
    2024-03-15
    3月10日,天津先行者队球员李荣培(中)在比赛中投篮。新华社记者 赵子硕 摄当日,在2023-2024赛季中国男子篮球职业联赛(CBA)常规赛第41轮比赛中,天津先行者队主场113比93战胜四川金强队。3月10日,天津先行者队
  • 新疆男篮主场击败北控 阿不都沙拉木突破
    2024-03-15
    3月10日,新疆伊力特队球员阿不都沙拉木(中)在北京控股队球员刘晓宇(右)、陈国豪的夹击防守下突破上篮。新华社记者 胡虎虎 摄当日,在2023-2024赛季中国男子篮球职业联赛(CBA)常规赛第41轮比赛中,新疆伊力特
  • 辽宁本钢胜深圳马可波罗 韩德君篮下强吃
    2024-03-15
    3月12日,辽宁本钢队球员韩德君(左二)在比赛中上篮。新华社记者 潘昱龙 摄当日,在2023-2024赛季中国男子篮球职业联赛(CBA)常规赛第42轮比赛中,辽宁本钢队主场109比98战胜深圳马可波罗队。3月12日,深圳马可波罗队球员萨林杰(左)在比赛中拼抢篮板球。新华社记者 潘昱龙 摄3月12日,辽宁本钢队球员张镇麟(中)在比赛中上篮。新华社记者 潘昱龙 摄3月12日,辽宁本钢队球员张镇麟(左上)在比赛中投篮。新华社记者 潘昱龙 摄3
  • 《谢谢你温暖我》央八首播,流水账记事,故事性差,李兰迪演技好
    2024-03-15
    3月9日,电视剧《谢谢你温暖我》在央八单集首播,在腾讯视频5集更新。基于目前已经上线的剧情内容来讲,这部电视剧在叙事上,过分流水账了,显然不足以用故事性吸引观众。在演技方面,李兰迪确实是该剧的加分项。收视率方面,后续来讲,该剧成绩应该不会好。这部电视剧的剧情梗概已经提前把主线故事亮明了,男女主角谈恋爱之后,男主角生病了,女主角不离不弃照顾男主。这当然是一个很有价值的主线,男女朋友之间,夫妻之间,相濡