产品展示
从通义千问“霸榜”开源榜单到斯坦福团队“抄袭”清华系AI公司中国大模型技术有多强? - OSCHINA

发布于:2024-06-07 00:02:14  来源:产品展示  点击量:14次

  斯坦福AI团队(Llama3-V)“镜像级套壳”清华系开源大模型(MiniCPM-Llama3-V 2.5)事件近日引发巨大关注——让人不禁感叹一句“国内一开源,国外就自主”。

  调侃归调侃,斯坦福AI团队抄袭事件相关的三名成员都有着卓越的学术和研发技术背景,并且在AI模型领域有着深厚的积累。他们本应避免将他人的成果直接宣称为自己的,这样的做法无疑是违背了开源社区所推崇的共享精神。

  此外,社区中的一些开发者也注意到了一个现象。在这次抄袭事件中,三人敢于公开抄袭MiniCPM,这背后可能基于一个判断:中国的开源模型虽然十分强大,但在国际社区中的知名度并不高。

  MiniCPM作为一个极其强大的开源模型,在发布后并没有正真获得应有的关注,反而是其套壳的海外版本意外走红。直到抄袭事件曝光,许多本应持续关注开源社区优秀作品的研究者才意识到MiniCPM的存在。

  就连抄袭事件的主角之一也在回应中所表示,他们“看了很多最近的论文以验证这项工作的创新性,但却并不知道也未被告知有关OpenBMB 的任何先前工作”。

  有DeepMind的工程师就指出,这件事里有意思的地方是,相比造假的Llama3-V,MiniCPM是真的存在的能达到如此强大能力的模型。但是它获得的关注是如此之少。同样的结果,就因为不是来自一些常青藤大学,就无法流行起来。

  还有一位国外 AI 社区的创始人也说道:“中国在机器学习生态的工作一直以来都被社区忽视了。他们正在用有趣的 LLM、VLM、音频和扩散模型做一些令人惊奇的事情。”

  通义千问不久前开源千亿参数大模型Qwen1.5-110B就在国外社区引起巨大反响,持续占领了Hacker News热度榜首一段时间。

  关于中国在AI领域落后的说法完全不属实。相反,他们正在为生态系统和社区做出重大贡献。”

  还有人表示,由于中英文间的语言障碍,海外通常能看到中国大模型也只是发布的一部分,太多AI应用和集成没有被完全展现。推测这些模型在中文上表现应该比英文更好。但即便如此,它们在英文基准测试上已具备相当的竞争力。

  也有人称自己属实被过去一年中Arxiv上AI论文里中文署名作者的庞大数量震惊到了。

  前斯坦福兼职讲师、Claypot AI联合发起人Chip Huyen在调研过900个流行开源AI工具后,在个人博客中分享自己的发现:“在GitHub排名前20的账户中,有6个源自中国。

  OpenAI早期投资人Vinod Khosla曾在X发文称,美国的开源模型都会被中国抄去。

  但这番言论马上被Meta的AI教父Yann LeCun反驳:“AI不是武器。无论我们是不是把技术开源,中国都不会落后。他们会掌控自己的人工智能,开发自己的本土技术栈。”

  还有在斯坦福读书的同学也分享称,教授在课堂上大力称赞中国开源模型,特别是开诚布公地与社区积极分享成果,跟欧美一些头顶“开源”名号的明星公司不同。

  有网友也表达了和这个教授相似的观点,“美国最该尴尬的,是今天中国开源模型们重大的贡献”。

  本文标题:从通义千问“霸榜”开源榜单到斯坦福团队“抄袭”清华系AI公司,中国大模型技术有多强?

  国内有个清华“专家”说中国的AI,落后美国,甚至于落后英国、日本等国家。

  悟空刘歧 (Steven Liu) 成为 FFmpeg 社区委员会成员

  禅道 20.1 发布,基于 PHP-APCu 实现数据缓存,优化 DevOps 交互

  《灯灯》多租户快速开发平台 4.19.0-java17-beta.1 版本发布,抢先体验新版UI

  roncoo-education 24.0.0 发布,微服务分布式在线教育开源系统

  开源日报 DuckDB 1.0.0;电脑死机;操作系统是应用生态的基础;Arm拿下Windows PC;大模型明星公司扎堆找“接盘侠”

  :fire: FolkMQ v1.5.2 发布 内嵌版(可内嵌的消息中间件)

  :fire::fire::fire:MakuBoot v4.2 发布,企业级低代码开发平台

  Taro 3.6.31 发布,BAT 小程序、H5 与 RN 端统一框架

  从通义千问“霸榜”开源榜单到斯坦福团队“抄袭”清华系AI公司,中国大模型技术有多强?

  使用12-factor的理念快速创建高可维护性的应用—叶峰 (1213开发者实践日)

  [ ECUG 专题回顾]《再谈 CERL:详论 GO 与 ERLANG 的并发编程模型差异》-许式伟

  【双十二】12 月 12 日 12 点 12 分限量抢福利,云计算不剁手!

  助力开发者进军海外市场 七牛全球加速服务上线 分钟搞明白如何在直播中去马赛克

  流畅度提高 100%!七牛云 QUIC 推流方案怎么来实现直播 0 卡顿?

  七牛融合 CDN 管理服务上线,携手 oschina 社区送券福利升级!

  ECUG Con 2018 早鸟票热卖中 大咖聚首 探索云计算下一个十年

  NIUDAY 11.23 北京站抢票啦 看 AI 落地行业 享 AI 时代红利

  [活动]开发者最佳实践日·第11期-HTML5与Native App应用技术实战

  架构师实践日 11.9 南京站报名 技术大牛带你剖析大数据平台内部演进中的挑战与实践

  我给自己的账户转几万块钱都被风控了,这个398万是怎么办到的,银行应该对此负责**

  我的技术文章被CSDN搬过去为什么没有人去踩缝纫机,这种报道在我看来就是一个笑话,有背景的妖怪没事,没背景的妖怪往死里打

  说的太对了。老周控制不了谷歌,但能控制360啊。己所不欲,勿施于人。应该先开源360所有产品。

  这也叫洗地?难道只有说特斯拉公布全部源代码就不是洗地了?某些人HWptds了吧?就是说下语言歧义而已,这也要上升到洗地?某些人是不是太聚光灯效应了啊?觉得他关注的人家一定是盯着的?

  好吧,最近体验了一下kotlin mutiplatform,还是能结合compose写UI的,网络请求是统一使用ktor吗?

  有一帮人是这样的,不明白他们经历过什么,涉及到HW不能说一点好话哪怕是中立也不行

  最近经常去面试,最讨厌阿里背景的人,感觉一个个都把我当傻子看,虽然我就是傻子

  新闻要连着看,除了 rustdesk,teamviewer,我在等第三个新闻。国产化远程桌面软件,遥遥领先。

  使用场景又哪些,与其他数据库比如doris,clickhouse有哪些优势?有没有案例

  性能太差的缘故是,不是谁的显卡驱动都到WDDM2.9,另外Android不需要虚拟机跑Linux内核怎么跑

  世人只知android出自google之手,几人晓得android只是google收购的产品,同理华为出资收编OGG开源工作并整编到自己的所有权产品线中有什么样的问题呢?

  佛教有个词很好,邪见。对待这样一个世界,预设立场得到的结论,是毫无意义的;接受良好的逻辑训练也很重要。

  deepin社区论坛戾气太重,后来个人PC用linux基本只用ubuntu和mint

  真正的魁首显然比这俩还要至少高一个层次。具体内部谁背锅,看谁和魁首关系好呗

  法国虽然是母社区,但github上OCCT的核心研发人员都是俄罗斯人,离了俄罗斯人,法国母社区也运营不下去。于是华为出手收编,迁移到中国,改个名字恢复开源和社区运营,有什么样的问题呢?

  我就是beetl作者,我并不认为那是安全漏洞,你缺少模板引擎的使用了解!你说我缺乏基本常识,那你解释一下脚本编辑权限是啥意思?另外,我看你并不是程序员,对软件开发有很多误解

  上个月绿联为了这系列产品专门做了一支伪发布会的视频,描述得很强很美好,看完了心动了一会。结果这特么严重到连像海康那样平安落地都不到呀,乐

  我一台I9cpu,64GB内存条,3080Ti电脑都比不上一台平板顶配19999...

  我让你六秒,和比武时我让你六招具有异曲同工的效果,表现了主人翁的强无敌和自信

  我建议360把所有的产品都开源,然后通过开源变成国内开源界的领军企业,领导着大家全力来对阵国外企业

  孤陋寡闻,不知道JDBC规范哪个版本对CVE视而不见?PrepareStatemet的占位符设计就是有防SQL注入的。有漏洞可以提,看看是不是会视而不见。JPA,Hibernate有QueryWrapper吗?自己手工拼的SQL或HQL有漏洞,你指责低级有漏洞,OK的,但是用QueryWrapper拼接,本身就为了不手写SQL,连column安全检查都不做说不过去吧。

  wine跑win的安卓模拟器、安卓模拟器里面安装chromeOS、chromeOS里面安装linux环境、linux环境安装wine

  个人用下来ToDesk的质量和向日葵是差不多的。向日葵最恶心的地方是把付费保存识别码的功能掉了,现在一添加就说已满,要我开通远程技术上的支持。而且复制粘贴别说文件图片,连文本经常无响应。于是才找到了ToDesk,付费了感觉还可以,起码能替掉付费的向日葵,复制文本的功能是正常的。不过最近也有小文件复制粘贴出错的问题,而且他们年后就没再更新过版本,一眼资金不行了。国外的除了速度问题,项目定位限制也不敢用,直接否决。

  但问题是:这对普通 Android 用户有什么用?现在的答案似乎是:几乎没有。

  这个怎么讲呢边全是这个orm,并且还要优雅,也重来没有听说过出bug难调一说,并且我觉得有问题你群里吱一声基本上我就回复了(#^.^#)

  周鸿祎现在活得越来越像个小丑,好好待在你幕后不好非要当网红,雷军你能学明白吗?

  什么活都给框架做了算了,要你们干啥的。这个也算SQL注入?这不就是相当于mybatis不使用#号,然后前端传入SQL片段,你还不如说mybatis有错误呢,MP不是也有检查方法吗?你不用怪谁?

  发现vfox好些个插件,都在用vmr的版本仓库的数据,而且是悄悄用脚本同步过去,不做任何声明的用。例如bun,julia, kubectl, protobuf等等。虽不是官方插件,但也是vfox贡献者在维护,也赫然列在插件列表。这vfox社区真是吃着别人的饭,还想砸别人的碗呢,厉害了。

  腾讯应用宝与 Microsoft Store 达成合作,Windows 可直接运行移动应用

  谷歌搜索 API 文档被意外发布到 GitHub:2500 多页、揭开搜索排名内幕