...

Why Nostr? What is Njump?

npub19ym…djan

2024-06-07 12:12:40

in reply to nevent1q…cfgc

今天我厂大模型组的贵清同学说通义千问2的700亿参数版本发布并开源了，安装测试了下，果然好用。

而且说通义千问这个模型已经在HuggingFace 的Open LLM Leaderboard开源模型榜单登顶了（见图1），太牛了啊。

我也手动测试了几个之前的bad case，结果都是对的（见图2和图3）。。提升巨大，我们现在用大模型处理数据的场景还是蛮多的，比如要标注笔记的正负面，标注对话数据的甲乙方，标注文章里面提到的品牌名称，地名等等。现在开源的大模型真是福音，方便我们这种有大量数据处理业务的企业了。

又安排员工把之前发现的其他大模型跑数据遇到的bad case都跑一遍，发现这一版通义千问在其他大模型跑出的bad case里面的表现正确率超过了75.2% （当然也有一些是错的，见图4）。其他大模型跑通过的case里面正确率达到99%。因为我们是有正确答案的，比较好统计，其实我可以给各家大模型在数据标注方面做测评啊，是不是又一个发财的机会啊。。

下一步还要测试下推理速度和成本，这个是大量使用的关键，小伙伴还在测试中，（待续）。

Author Public Key

npub19ymyv276scfw9y83wgclmh9f5evtgungpjmxrdfhkyfp6keadqasy8djan

Show more details

Published at

2024-06-07 12:12:40

Kind type

1 Short Text Note

Event JSON

{ "id": "aa518952e3e28642b44c616bb25cd5bb53e24985780f7cd304369d74b949f10e", "pubkey": "2936462bda8612e290f17231fddca9a658b472680cb661b537b1121d5b3d683b", "created_at": 1717755160, "kind": 1, "tags": [ [ "e", "9ca31705212eb454d564fc8b5e7c4b383cf61cd70beab5ae771c32a8c81c1a8f", "", "root" ], [ "p", "2936462bda8612e290f17231fddca9a658b472680cb661b537b1121d5b3d683b" ] ], "content": "今天我厂大模型组的贵清同学说通义千问2的700亿参数版本发布并开源了，安装测试了下，果然好用。\n\n而且说通义千问这个模型已经在HuggingFace 的Open LLM Leaderboard开源模型榜单登顶了（见图1），太牛了啊。\n\n我也手动测试了几个之前的bad case，结果都是对的（见图2和图3）。。提升巨大，我们现在用大模型处理数据的场景还是蛮多的，比如要标注笔记的正负面，标注对话数据的甲乙方，标注文章里面提到的品牌名称，地名等等。现在开源的大模型真是福音，方便我们这种有大量数据处理业务的企业了。\n\n又安排员工把之前发现的其他大模型跑数据遇到的bad case都跑一遍，发现这一版通义千问在其他大模型跑出的bad case里面的表现正确率超过了75.2% （当然也有一些是错的，见图4）。其他大模型跑通过的case里面正确率达到99%。因为我们是有正确答案的，比较好统计，其实我可以给各家大模型在数据标注方面做测评啊，是不是又一个发财的机会啊。。\n\n下一步还要测试下推理速度和成本，这个是大量使用的关键，小伙伴还在测试中，（待续）。\n\nhttps://i.postimg.cc/W3y9wnYc/593af2a7gy1hqgliz55wej20z80i1ame.jpg\nhttps://i.postimg.cc/QCWf4Tv9/593af2a7gy1hqglj3m877j212s0p2k9e.jpg\nhttps://i.postimg.cc/tRZyQmjP/593af2a7gy1hqglj6ec9fj21160pzwwn.jpg\nhttps://i.postimg.cc/HWqmp4YN/593af2a7gy1hqgljqobchj21360r3aof.jpg\n", "sig": "44c0bcae6704ee07086b090a1d48790d4edef553f76fcb25a0bae6807ff58fc282695418a51ef1c9a26c2808469329fe6cca3771294782b0db38a289ea58eb3a" }