温馨提示:本文因通过全面对“ChatGPT和文心一言”代表的“AI语言处理应用工具”进行通俗语言式的科普,故阅读需要4-6分钟。
微软:一方面自从今年2月推出由ChatGPT支持的最新版本人工智能搜索引擎Bing(必应)和Edge浏览器之后,宣布会陆续将其整合Word、PowerPoint、Outlook和其他应用程序中,便于用户可以通过简单提示自动生成文本。
另一方面,打造上万张(单片就号称计算卡“超级核弹”)英伟达A芯片为训练ChatGPT提供超级算力,并且部署了几十万张GPU用于ChatGPT的推理。
ChatGPT第一个需要是:干净的知识库
ChatGPT和文言一心都是由超级云计算能力支持、由“知识收集、知识学习、知识外用”三个步骤构成的“语言处理应用工具”。
人机问答的交互、以及生成图文或视频进行知识输出,都只是表现的形式。知识分类、数据标签、单元归集、结构建模、知识增强、对话增强、知识推理、提示构建等等,基于统计概率提升的仿真智能学习之后,再反馈给用户精确信息的外用回答,都有一个不可回避的前提:海量的、标准化的、符合计算机有序处理的知识源头。
简单理解就是“语言处理应用工具”本身是一个智能图书馆。只不过它不需要你像在图书馆里,先找到书、再翻书记录对自己有用的知识点、再写作文那样。
而是,它会像一个客服只需你说出需要什么,然后就自己利用“第几排、第几层、第几本、第几章、第几节、第几段、第几句”有序性查找能力、结合你提出问题之间的关联性,按照评估出来最接近你想要的结果进行组合,帮你写出文字、或编辑出图片、或编辑出视频交给你。
所以,无论说它的知识外用能力有多强,其“语言处理应用”的本质:只是知识拼接,而不是创造发明。
这就好比我们去饭店吃饭、却没有食物。只有图书馆没有图书,无论建筑形体多么富丽堂皇、室内绿化多么漂亮、电梯多么快速,注定结局是倒闭关门。
所有的小型电脑的操作系统,除了微软、仅有基于posix接口的unix类,像大家熟悉的安卓、鸿蒙、linux、iOS、MacOS这些系统。这意味什么,不言而喻!
图片来自网络,如侵权请联系,必删除!文心一言有其他人缺的:在线知识库
我国高校与企业研究布局“语言处理应用工具”的时间并不晚。ChatGPT之父山姆·阿尔特曼SamAltman与埃隆·马斯克共同创立OpenAI的时间是年。
年开始,腾讯的写作机器人Dreamwriter,在采集相关文章的文字结构和针对用户需求的基础上,根据数据输入、触发条件设定、模板风格取舍,经过数据服务、触发、写作、智能校验、智能分发,每年可以创作大约0万篇拥有著作权的作品。此外,腾讯还专门成立了针对类ChatGPT对话式产品的“混元助手(HunyuanAide)”项目组。
图片来自网络截图,如有不妥请联删!清华大学的孙茂松教授,年就带领团队研发出能写诗的“九歌”。此外,清华大学唐杰教授带领队研发的ChatGLM也是初具问题和对话功能的千亿中英语言模型。中国科学院的“小初”也拥有视频生成、智能问答、语音合成等多种能力。
阿里云不仅与新华社联合成立了新华智云科技自主研发了媒体大脑,在年12月发布了耗时只有10.秒生成内容的MGC(机器生产内容)视频新闻,而且还在进行“阿里通义AliceMind”大模型的研发。
但是,如同没有或者藏书量的图书馆对读者的吸引力总是不够的限局性一样。
高校的知识图库的知识储备过于专业性、阿里在新浪微博和VC浏览器加持下的知识储备偏娱乐属性、腾讯在