DeepSeek这家中国人工智能公司正在迅速崛起,其强大的AI模型以低廉的成本挑战着硅谷巨头的统治地位。2024年12月,DeepSeek发布了其大型语言模型DeepSeek V3,该模型不仅免费开放,而且在第三方测试中,其性能超过了Meta的Llama 3.1、OpenAI的GPT-4o和Anthropic的Claude Sonnet 3.5,展现出在解决复杂问题、数学和编码方面的出色准确性。更令人瞩目的是,DeepSeek V3的研发成本不到600万美元,仅耗时两个月,使用了受美国禁令影响而性能有所降低的Nvidia H800 GPU,而非市场上最强大的AI芯片。 DeepSeek并未止步于此。1月20日,该公司又发布了名为DeepSeek R1的全新模型,该模型具有强大的推理能力,并在Github上开源。第三方评估显示,DeepSeek R1在多项测试中甚至超越了OpenAI最新的模型。DeepSeek R1的成本优势也十分显著,其产品经理Shubham Saboo表示,DeepSeek R1的成本比OpenAI o1低96.4%,每百万token的输出成本仅为2.19美元,而OpenAI o1则高达60美元。 DeepSeek的成功引发了广泛关注。微软CEO萨蒂亚·纳德拉在达沃斯世界经济论坛上表示,DeepSeek的新模型令人印象深刻,并强调需要认真对待中国在AI领域的进展。许多专家认为,DeepSeek能够以低成本创造出高性能的LLM,这与其在模型架构和算法上的创新密不可分,例如其自主研发的MLA(多头潜在注意力)架构和DeepSeekMoESparse结构有效降低了内存使用率和计算成本。 DeepSeek的崛起也让美国在AI领域的全球领先地位受到质疑,并引发了人们对大型科技公司巨额投入AI模型和数据中心的效率的反思。DeepSeek的成功并非个例,其他中国公司,如01.ai和字节跳动,也纷纷推出具有竞争力的低成本、高性能LLM,这预示着AI领域的竞争格局正在发生深刻变化。DeepSeek的成功经验值得借鉴,它证明了在资源受限的情况下,通过创新和高效的策略同样可以取得突破性的进展。
东北证券首席经济学家付鹏近期在汇丰银行发表的演讲引发广泛关注,其核心...
算力已成为国家竞争力的重要标志,人工智能时代的到来更是加速了全球在算...
中粮资本发布了中粮信托有限责任公司2024年财务报表(未经审计),这...
币安官方推出了一项活动,只要使用币安Web3钱包参与Ton生态,就能...
在汽车电路中正确安全地连接电灯线至关重要,这不仅关系到电路的正常运行...