昆仑万维发布天工AI搜索，和文心一言谁更靠谱？

银柿财经 2023-08-24 07:44:23

8月23日，昆仑万维（300418.SZ）宣布推出国内首款融入大语言模型的搜索引擎——天工AI搜索，并开启内测申请。

(资料图片仅供参考)

公司称，传统搜索引擎基于关键词匹配，用户需要将大量时间耗费在“寻找”和“筛选”上，而基于大模型能力的AI搜索是一种生成式搜索，用户可通过自然语言清晰表达自己的意图，并获得有效组织和提炼后的答案，不再为冗余信息浪费时间；而由于大语言模型的生成机制无法完全规避“一本正经地胡说八道”，天工AI搜索在所有回答中加入了信源索引，以此保障答案可追溯、可考证、可信赖。

此外，昆仑万维称，天工AI搜索也即将具备图像、语音等多模态搜索能力，更大程度地释放生产力、提升用户效率。

天工AI搜索主界面

作为搜索引擎的天工，与作为生成式AI的文心一言，区别何在？银柿财经在天工AI搜索上提出了这个问题，以下是它的回答：

图源：天工AI搜索

而问及“为什么在有文心一言的情况下，昆仑万维还要说你是国内首个AI搜索引擎”，天工则首先感谢了用户的提问，并表示天工能够做到自然语言人机交互，与一般的关键词匹配搜索引擎存在较大区别，且支持“追问”等交互功能，也能融合并处理多种信息，包括文字信息、图像、视频等，因此昆仑万维认为，通过天工AI搜索的推出，使得搜索技术和使用体验都得到了进一步提高，因此可以被认为是国内首个AI搜索引擎。

图源：天工AI搜索

不过，天工的“追问”与文心一言、ChatGPT的AI对话还是有所区别，在“追问”时需要用户注意与上文的关联性。例如，银柿财经要求天工一起玩成语接龙，面对银柿财经提出的“龙腾虎跃”，天工AI很好地回答了“跃马扬鞭”，但当银柿财经继续回复“鞭辟入里”时，天工并未理解这是成语接龙的下一个词，而是解释了“鞭辟入里”的含义。

图源：天工AI搜索

对于天工引擎与此前推出的天工AI助手的区别，天工引擎的官方回答则是这样的：

图源：天工AI搜索

在实时性方面，由于是搜索引擎性质，天工的表现相对良好。例如时下“日本排放核废水入海”的新闻，天工的回答相对文心一言时效性更强。在银柿财经进一步追问“日本是否已经决定排放核废水入海”时，文心一言的答案是“还没有”。

图源：天工AI搜索

图源：文心一言

而在准确性方面，银柿财经提出了一个有确定答案的问题：昆仑万维2022年的业绩。文心一言与天工均给出了答案，但天工的答案更加准确、详细，文心一言给出的数字则与年报本身略有出入。

图源：文心一言

图源：天工AI搜索

不过，在逻辑性与生活情境方面，天工似乎有些难以识别。由于天工给出的参考信息较多来自知乎，银柿财经选择了知乎上的一个问题：“有人敲门，水烧开了，电话响了，孩子哭了，应该先管哪个？”天工给出的回答是应对孩子哭闹的方法，而文心一言有理有据地给出了参考建议的操作顺序。

图源：天工AI搜索

图源：文心一言