收集未整理的技术新闻

干啥的

仅仅是收集新闻

Mind2Web: Towards a Generalist Agent for the Web

Mind2Web: 基于LLM构建操作网页的通用代理

使用自然语言指令,在任何网站上完成复杂的任务,比如订机票、订酒店、微博上关注来去之间并点赞、分期付款买手机、Netflix上播放视频等等操作

并且这些任务可以跨网站,例如从购物网站跳转到支付网站。

另外一个技术细节就是通常真实网站的HTML通常都很大,无法让LLM直接处理,所以他们用了一个小模型先对HTML进行过滤,然后再让LLM操作。

当然现在测试的网站还不够多,期待未来能更加通用。

论文:[2306.06070] Mind2Web: Towards a Generalist Agent for the Web
项目地址:osu-nlp-group.github.io/Mind2Web🔗

小模型撬动大模型高效推理

LLM推理提速2.8倍,CMU提出「投机式推理」引擎SpecInfer,小模型撬动大模型高效推理

哔哩哔哩大规模AI模型推理实践