8月23日,昆仑万维(300418.SZ)宣布推出国内首款融入大语言模型的搜索引擎——天工AI搜索,并开启内测申请。
(资料图片仅供参考)
公司称,传统搜索引擎基于关键词匹配,用户需要将大量时间耗费在“寻找”和“筛选”上,而基于大模型能力的AI搜索是一种生成式搜索,用户可通过自然语言清晰表达自己的意图,并获得有效组织和提炼后的答案,不再为冗余信息浪费时间;而由于大语言模型的生成机制无法完全规避“一本正经地胡说八道”,天工AI搜索在所有回答中加入了信源索引,以此保障答案可追溯、可考证、可信赖。
此外,昆仑万维称,天工AI搜索也即将具备图像、语音等多模态搜索能力,更大程度地释放生产力、提升用户效率。
作为搜索引擎的天工,与作为生成式AI的文心一言,区别何在?银柿财经在天工AI搜索上提出了这个问题,以下是它的回答:
而问及“为什么在有文心一言的情况下,昆仑万维还要说你是国内首个AI搜索引擎”,天工则首先感谢了用户的提问,并表示天工能够做到自然语言人机交互,与一般的关键词匹配搜索引擎存在较大区别,且支持“追问”等交互功能,也能融合并处理多种信息,包括文字信息、图像、视频等,因此昆仑万维认为,通过天工AI搜索的推出,使得搜索技术和使用体验都得到了进一步提高,因此可以被认为是国内首个AI搜索引擎。
不过,天工的“追问”与文心一言、ChatGPT的AI对话还是有所区别,在“追问”时需要用户注意与上文的关联性。例如,银柿财经要求天工一起玩成语接龙,面对银柿财经提出的“龙腾虎跃”,天工AI很好地回答了“跃马扬鞭”,但当银柿财经继续回复“鞭辟入里”时,天工并未理解这是成语接龙的下一个词,而是解释了“鞭辟入里”的含义。
对于天工引擎与此前推出的天工AI助手的区别,天工引擎的官方回答则是这样的:
在实时性方面,由于是搜索引擎性质,天工的表现相对良好。例如时下“日本排放核废水入海”的新闻,天工的回答相对文心一言时效性更强。在银柿财经进一步追问“日本是否已经决定排放核废水入海”时,文心一言的答案是“还没有”。
而在准确性方面,银柿财经提出了一个有确定答案的问题:昆仑万维2022年的业绩。文心一言与天工均给出了答案,但天工的答案更加准确、详细,文心一言给出的数字则与年报本身略有出入。
不过,在逻辑性与生活情境方面,天工似乎有些难以识别。由于天工给出的参考信息较多来自知乎,银柿财经选择了知乎上的一个问题:“有人敲门,水烧开了,电话响了,孩子哭了,应该先管哪个?”天工给出的回答是应对孩子哭闹的方法,而文心一言有理有据地给出了参考建议的操作顺序。
至于AI图片生成,由于是搜索引擎,天工给出了搜索结果,但图片无法显示;文心一言则顺利生成了相关图片。
在帮助写稿方面,文心一言与天工引擎的表现则旗鼓相当。
综上,从银柿财经的初步测试来看,在解决AI可能会“一本正经地胡说八道”的问题方面,天工引擎的确能够准确、有理有据地给出具有时效性的回答;而在理解生活情境与图片生成创作方面,文心一言则略胜一筹。银柿财经将持续关注。