还不如直接收复缅甸,像特朗普学习,兼并格…
路透北京1月27日电- - -中国初创公司DeepSeek推出最新的人工智能模型,称其成本仅为美国业界领先模型的一小部分,与美国的模型相当甚至更好,这可能会扰乱科技世界的秩序。
该公司上个月在一篇论文中写道,DeepSeek-V3的训练只需要英伟达H800芯片不到600万美元的计算能力,这引起了全球人工智能界的关注。
由DeepSeek- v3驱动的DeepSeek人工智能助手已经超过竞争对手ChatGPT,成为美国苹果应用商店中排名最高的免费应用程序。
这引发了人们对一些美国科技公司决定承诺数十亿美元人工智能投资背后的原因的质疑,包括英伟达在内的几家大型科技公司的股票受到了打击。
以下是该公司撼动全球人工智能领域的一些事实。
为什么deepseek会引起轰动?
OpenAI的ChatGPT于2022年底发布,引起了中国科技公司的争夺,他们争相创造自己的人工智能聊天机器人。
但在搜索引擎巨头百度(9988 . hk)推出首个中国版ChatGPT之后,中国对美国和中国公司在人工智能能力方面的差距普遍感到失望。
DeepSeek模型的质量和成本效益颠覆了这种说法。这家中国初创公司表示,DeepSeek-V3和DeepSeek-R1这两款深受硅谷高管和美国科技公司工程师好评的机型,与OpenAI和Meta最先进的机型不相上下。
它们使用起来也更便宜。根据DeepSeek官方微信账户上的一篇文章,上周发布的DeepSeek- r1比OpenAI 01型号便宜20到50倍,具体取决于任务。
DeepSeek 到底是什么?
DeepSeek由量化基金幻方量化负责人梁文峰于2023年创立。该公司开发的AI模型是开源的,这意味着整个开发人员社区都可以检查和改进软件。其移动应用在1月初发布后,在美国 iPhone下载排行榜上飙升至榜首。
该应用程序与OpenAI的ChatGPT等其他聊天机器人的区别在于,在对提示做出响应之前阐明其推理。该公司声称其R1版本提供的性能与OpenAI的最新版本相当,并已向有兴趣使用该技术开发聊天机器人的个人授予许可。
DeepSeek R1与OpenAI或Meta的模型相比如何?
虽然DeepSeek并未全面披露其R1新模型的细节,但该模型的训练和开发成本似乎仅为OpenAI或Meta最强产品的一小部分。R1的效率显然要高得多,这不禁让人质疑业界是否仍需要投入大量资金去购买英伟达等公司的最新、最强大的AI加速器。这也让外界更加关注美国针对中国的先进AI芯片出口管制,因为这些管制就是为了防止中国取得像DeepSeek这样的突破。
DeepSeek表示,R1模型在几个主要基准测试中的表现接近或超越了竞争对手的模型,例如测试数学能力的AIME 2024、测试常识的MMLU和测试问答性能的AlpacaEval 2.0。它还在加州大学伯克利分校研究生开发的AI系统排名网站Chatbot Arena上名列前茅。
DeepSeek何时引发了全球关注?
自从2023年发布最早模型以来,DeepSeek就一直备受关注。去年11月,它向世界预览了旨在模仿人类思维的DeepSeek R1推理模型,为其移动聊天机器人应用提供了技术支持。再加上网页版,该聊天机器人迅速成为全球知名的廉价OpenAI替代品。硅谷知名投资人马克·安德森(Marc Andreessen)称其为“AI的斯普特尼克时刻”(源自冷战时期的历史术语,现已成为一种隐喻,用来描述某个事件或时刻引发强烈的危机感或紧迫感,促使国家、组织或个人采取行动以应对竞争或挑战)。
说了半天说不清楚DeepSeek到底是什么?