2023-09-25 10:23:40 发布人:hao333 阅读( 2052)
据 Arxiv 页面显示,来自苏州大学的一个研发团队近日推出一款名为 OpenBA 的开源 seq2seq 模型。据悉, OpenBA 是一款具有150亿参数的...
据 Arxiv 页面显示,来自苏州大学的一个研发团队近日推出一款名为 OpenBA 的开源 seq2seq 模型。
据悉, OpenBA 是一款具有150亿参数的双语非对称seq2seq模型,也是首个加入中国开源模型社区的大语言模型变体。论文显示,研究者采用高效的技术以及采用三阶段的训练策略,从头开始训练了OpenBA模型。
实验显示,OpenBA 在 BELEBELE 基准测试中的性能优于 LLaMA-70B,在 MMLU 基准测试中的性能优于 BLOOM-176B,在 C-Eval基准测试中的性能优于 GLM-130B。
相关阅读
RelatedReading猜你喜欢
Guessyoulike