返回首页

全球最长上下文窗口大模型发布

时间:2023-11-02 来源:原创/投稿/转载作者:管理员点击:

  北京人工智能大模型企业百川智能日前发布Baichuan2-192K大模型,其上下文窗口长度达192K,是目前全球最长的上下文窗口,能够处理约35万个汉字,是目前支持长上下文窗口最优秀大模型Claude2的4.4倍,更是大模型GPT-4的14倍。

  上下文窗口长度是大模型的核心技术之一,通过更大的上下文窗口,模型能够结合更多上下文内容获得更丰富的语义信息,更好地捕捉上下文相关性,消除歧义,进而更加准确、流畅地生成内容,提升模型能力。根据评测,Baichuan2-192K在Dureader、NarrativeQA、LSHT、TriviaQA等10项中英文长文本问答、摘要的评测集上表现优异,有7项取得SOTA(State of the art,意为“最先进的”),显着超过其他长窗口模型。

  基于长上下文窗口能力,Baichuan2-192K能够一次性处理和分析数百页的材料,对于长篇文档关键信息提取与分析,长文档摘要、长文档审核、长篇文章或报告编写、复杂编程辅助等真实场景都有巨大的助力作用。据悉,Baichuan2-192K现已正式开启内测,以应用程序接口调用的方式开放给核心合作方,目前已经与财经类媒体及律师事务所等机构达成了合作,将领先的长上下文能力应用到传媒、金融、法律等具体场景当中,不久后将全面开放。

【责任编辑:管理员】
随机推荐 更多>>