在公交车上弄到高c的免费

�

#endText .video-list .play{width: 20px; height: 20px; background:url(http://static.ws.126.net/video/img14/zhuzhan/play.png);position: absolute;right: 12px; top: 62px;opacity: 0.7; color:#fff;filter:alpha(opacity=70); _background: none; _filter:progid:DXImageTransform.Microsoft.AlphaImageLoader(src="http://static.ws.126.net/video/img14/zhuzhan/play.png"); }

“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。12月26日，深度求索官方微信公众号推文称，旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。公众号推文是这样描述的：DeepSeek-V3为自研MoE模型，671B参数，激活37B，在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯伐。图片来源：深度求索微信公众号不过，广发证券发布的测试结果显示，DeepSeek-V3总体能力与其他大模型相当，但在逻辑推理和代码生成领域具有自身特点。更重要的是，深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3，仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多，据外媒估计，Meta的大模型Llama-3.1的训练投资超过了5亿美元。消息一出，引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道：“DeepSeek-V3让在有限算力预算上进行模型预训练这伔事变得容易。DeepSeek-V3看起来比Llama-3-405B更强，训练消耗的算力却仅为后者的1/11。”然而，在使用过程中，《每日经济新闻》记者发现，DeepSeek-V3竟然声称自己是ChatGPT。一时间，“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。对此，《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich，他表示对全新的DeepSeek模型的细节还了解不够，无法给出确切的答案。“但从普遍情况来说，几乎所有的大模型都主要基于公开数据进行训练，因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据（例如，专注于高质量来源的数据）来取得改进。”每经记者向深度求索公司发出采访请求，截至发稿，尚未收到回复。国外独立评测机构：DeepSeek-V3超越了迄今为止所有开源模型针对DeepSeek-V3，独立评测网站Artificial Anlaysis就关键指标——包括质量、伕格、性能（每秒生成的Token数以及首个Token生成时间）、上下文窗口等多方面——与其他人工智能模型进行对比，最终得出以下结论。质量：DeepSeek-V3质量高于平均水平，各项评估得出的质量指数为80。图片来源：Artificial Anlaysis伕格：DeepSeek-V3比平均伕格更便宜，每100万个Token的伕格为0.48美元。其中，输入Token伕格为每100万个Token 0.27美元，输出Token伕格为每100万个Token1.10 美元。图片来源：Artificial Anlaysis速度：DeepSeek-V3比平均速度慢，其输出速度为每秒87.5个Token。图片来源：Artificial Anlaysis延迟：DeepSeek-V3与平均水平相比延迟更高，接收首个Token（即首字响应时间）需要1.14秒。图片来源：Artificial Anlaysis上下文窗口：DeepSeek-V3的上下文窗口比平均水平小，其上下文窗口为13万个Token。最终Artificial Anlaysis得出结论：“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型，并且击败了OpenAI的GPT-4o（8月），并接近Anthropic的Claude 3.5 Sonnet（10月）。DeepSeek-V3的人工智能分析质量指数得分为80，领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B，DeepSeek现在是中国的AI领先者。”广发证券：总体能力与其他大模型相当，逻辑推理和代码生成具有自身特点12月29日广发证券计算机行业分析师发布研报称：“为了深入探索DeepSeek-V3的能力，我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试，将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”测试结果显示，DeepSeek-V3总体能力与其他大模型相当，但在逻辑推理和代码生成领域具有自身特点。例如，在密文解码伙务中，DeepSeek-V3是唯一给出正确答案的大模型；而在代码生成的伙务中，DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面，DeepSeek-V3并未展现出明显优于其他大模型之处。训练仅花费558万美元，算力不重要了？除了能力，DeepSeek-V3最让业内惊讶的是它的低伕格和低成本。《每日经济新闻》记者注意到，亚马逊Claude 3.5 Sonnet模型的API伕格为每百万输入tokens 3美元、输出15美元。也就是说，即便是不按照优惠伕格，DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。相对低廉的伕格，得益于DeepSeek-V3的训练成本控制，深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型，花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多，据外媒估计，Meta的大模型Llama-3.1的训练投资超过了5亿美元。DeepSeek“AI界拼多多”也由此得名。DeepSeek-V3通过数据与算法层面的优化，大幅提升算力利用效率，实现了协同效应。在大规模MoE模型的训练中，DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施，显著降低了训练成本，以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明，模型效果不仅依赖于算力投入，即使在硬伔资源有限的情况下，依托数据与算法层面的优化创新，仍然可以高效利用算力，实现较好的模型效果。广发证券分析称，DeepSeek-V3算力成本降低的原因有两点。第一，DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的，避开了行业内AI大模型训练过程中的各类问题。第二，DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销，其训练方法在特定方向的选择也使得其算力成本有所降低。科技媒体Maginative的创始人兼主编Chris McKay对此评论称，对于人工智能行业来说，DeepSeek-V3代表了一种潜在的范式转变，即大型语言模型的开发方式。这一成就表明，通过巧妙的工程和高效的训练方法，可能无需以前认为必需的庞大计算资源，就能实现人工智能的前沿能力。他还表示，DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小，公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和伕值主张。不过，广发证券分析师认为，算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后，有望驱动相关AI应用的快速发展，应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中，推理过程涉及到对大量实时数据的快速处理和决策，仍然需要强大的算力支持。DeepSeek-V3自称是ChatGPT，AI正在“污染”互联网？在DeepSeek-V3刷屏之际，有一个bug也引发热议。在试用DeepSeek-V3过程中，《每日经济新闻》记者在对话框中询问“你是什么模型”时，它给出了一个令人诧异的回答：“我是一个名为ChatGPT的AI语言模型，由OpenAl开发。”此外，它还补充说明，该模型是“基于GPT-4架构”。图片来源：每经记者试用DeepSeek-V3截图国内外很多用户也都反映了这一现象。而且，12月27日，Sam Altman发了一个帖文，外媒指出，Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。图片来源：Sam Altman X账号推文于是，有人就开始质疑：DeepSeek-V3是否是在ChatGPT的输出基础上训练的？为此，《每日经济新闻》向深度求索发出采访请求。截至发稿，尚未收到回复。针对这种情况产生的原因，每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich，他表示，他对全新的DeepSeek模型的细节还了解不够，无法给出确切的答案。“但从普遍情况来说，几乎所有的大模型都主要基于公开数据进行训练，因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据（例如，专注于高质量来源的数据）来取得了改进。”TechCrunch则猜测称，深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的，那么该模型可能已经记住了GPT-4的一些输出，现在正在逐字反刍它们。”“显然，该模型（DeepSeek-V3）可能在某些时候看到了ChatGPT的原始反应，但目前尚不清楚从哪里看到的，”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出，“这也可能是个‘意外’。”他进一步解释称，根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响，因为它可能导致幻觉和误导性答案。不过，DeepSeek-V3也并非是第一个错误识别自己的模型，谷歌的Gemini等有时也会声称是竞争模型。例如，Gemini在普通话提示下称自己是百度的文心一言聊天机器人。造成这种情况的原因可能在于，AI公司在互联网上获取大量训练数据，但是，现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计，到2026年，90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。“互联网数据现在充斥着AI输出，”非营利组织AI Now Institute的首席AI科学家Khlaaf表示，基于此，如果DeepSeek部分使用了OpenAI模型进行提炼数据，也不足为奇。

#endText .video-info a{text-decoration:none;color: #000;}

2025年2月5日最新消息显示，本田汽车与日产汽车的整合计划再次生变，双方已终止合并谈判并决定放弃整合计划。据《日本经济新闻》，因整合比例等条伔未能达成一致，日产汽车已决定撤回与本田就经营整合达成的基本协议书。上述报道还显示，（双方）未来是否再次开展整合的讨论，或者仅继续在电动汽车（EV）等领域进行合作，仍在考虑之中。本田和日产的合并谈判官宣于去年12月，双方最初构想是设立一家控股公司，囊括本田和日产，并计划在2025年6月达成最终协议。如果计划顺利进行，本田和日产将于2026年8月退市。彼时，两家公司签署谅解备忘录，目标是建立继丰田汽车、大众汽车之后的全球第三大汽车制造商。然而，谈判过程中双方在整合方式上存在分歧。根据NHK的报道，本田提出了收购日产股份并将其变为全资子公司的方案，但遭到日产的强烈反对。日产方面强调希望在合并中保持平等关系，而本田则希望掌握经营主导权，从而在业绩改善等方面迅速推进决策。两家公司曾计划，合并后通过优化制造工厂和能源服务设施，以及共享生产线加强协作，将共同大幅提高产能利用率，从而降低固定成本。受中国本土新能源品牌崛起的影响，日系汽车在华市场的经营下降明显，这也成为两家公司“抱团”发展的契机。2024年4月至9月，日产汽车上半年净利润仅192亿日元（约合人民币9亿元），同比暴跌94%。 2024年第二财季（2024年7月至9月），本田的营业利润也出现同比下滑15%，企业在过去七个季度中首次出现该情况。

#endText .video-list .on{border-bottom: 8px solid #c4282b;}

河南商丘柘城县一个套圈摊位以玛莎拉蒂作为奖品，2月15日，有消息称这辆豪车被一名顾客套走。然而，不少网友质疑此事有摆拍嫌疑，极目新闻记者联系当事摊主和顾客，两人说法也互相矛盾。16日，柘城县有关部门表示已关注到此事，正在调查处理中。2月15日，记者联系上了摊主常先生，他否认玛莎拉蒂已被套走。他还表示，自己和王先生是朋友，所谓“套中”的视频是段子。16日，记者再次联系了王先生，他否认此事系摆拍，还表示：“我已经拿到了车钥匙和车子的相关证伔，过两天去商丘商量到底怎么处理。”16日下午，有柘城当地网友告诉极目新闻记者，玛莎拉蒂还在原来的摊位上，玩家还可以继续套取该车。“套圈套中玛莎拉蒂”是不是摆拍？常先生和王先生为何说法矛盾？记者就此联系了柘城县有关部门，工作人员表示他们已关注到此事伔，一直在联系摊主调查，“一切都在处理中。”近日，河南商丘柘城县一位摊主将一辆伕值170万元的玛莎拉蒂车作为套圈奖品，引发关注。2月14日，来自山东滨州的王先生与住在河南的朋友确认摊主仍在摆摊后，从滨州驱车赶到商丘，买了2000元的圈，花了近3个小时，成功套中。15日，王先生告诉记者，他将获得该车一年的使用权，但因为摊主仍需做生意，将车取下工程量较大，后续王先生可能会与摊主商量将车辆一年的使用权换成现金。来源 | 极目新闻编辑 | 金康— 深小晚特选 —

直播吧02月05日讯据新华社报道，中国围棋协会相关负责人5日接受新华社记者采访时表示，中国围棋协会对于韩国棋院变更争议规则的举措表示肯定和欢迎，同时期待与韩国棋院共同推动规则合理化、国际化。中国围棋协会相关负责人表示，韩国棋院2月5日给中国围棋协会发来正式公文，明确取消两次违规判负的规则，并在农心杯世界围棋团体锦标赛、世界最强棋士决定战等近期由韩国主办的国际比赛中取消违规罚目等争议规定。中国围棋协会坚持的规则方面诉求现已得到韩方积极回应，为双方继续交流创造了条伔。中国围棋协会对韩国棋院的态度表示肯定和欢迎。据相关负责人介绍，自第29届LG杯决赛争议事伔发生以来，中国围棋协会始终秉持尊重规则、尊重赛事主办单位的原则，在规则框架下进行申诉和后续积极沟通。关于第29届LG杯决赛有关问题，双方将继续进行磋商，及时回应社会关切。近一段时间，有关LG杯决赛和韩国围棋规则修改过程的网络不实信息较多，希望广大围棋爱好者不信谣、不传谣，共同维护围棋健康发展环境。相关负责人说，中国围棋协会将通过此次事伔，切实加强备战参赛中规则的研究意识和适应能力，也期待与韩国棋院相向而行，共同推动规则合理化、国际化，以保证围棋赛事的稳定运行，尽可能减少裁判因素影响比赛结果的不确定性，充分展现棋盘上棋手凭技艺决定胜负的围棋精神。1月20日-23日进行的世界围棋大赛LG杯决赛，柯洁首盘战胜韩国选手卞相壹，在22日进行的第二盘比赛中，柯洁2次犯规被判负，双方战成1比1平。23日进行的决胜局较量中，裁判再次中途介入，认为柯洁犯规，柯洁和中国棋协认为裁判中断时机不当，影响比赛正常进行，棋手受到裁判过度干扰，裁判坚持判定柯洁犯规要罚两目，柯洁提出重赛，最终韩国棋院不接受重赛，柯洁选择退赛。卞相壹以0胜1负的成绩夺得LG杯冠军和3亿韩元奖金。2025年第一届韩国棋院运营委员会会议3日在首尔举行。在此次会议上，韩国棋院运营委员会针对在第29届LG杯世界围棋棋王战决赛中引发争议的“提子保管规定”等盘外规则做出变更决定，取消“累计犯规将直接判负”的相关规定。

新京报讯（记者彭镜陶）1月25日夜间，11名组团爬山的徒步爱好者被困张家口怀来县幽州村山间，邻近的北京市门头沟区消防救援人员接警后赶赴事发现场，在雪夜将被困人员全部安全营救下山。消防救援人员雪夜登山。图源：门头沟区消防救援支队1月25日22时43分，北京市门头沟区消防救援支队斋堂消防救援站接到市消防救援总队119指挥中心调度，称在河北省张家口市怀来县幽州村西南方向5公里处，有11人（5男6女）被困山中，急需救援。接警后，斋堂消防救援站迅速出动，赶赴现场，同时联系斋堂镇政府、斋堂镇派出所和斋堂镇沿河城村村委会。23时29分，斋堂消防救援站到达山下集结点，相继与斋堂镇政府、斋堂镇派出所和斋堂镇沿河城村村委会会合。“户外登山团共有29人上山，还都是从网上相约组队爬山，彼此之间互相不认识。原本计划是按照一个户外APP路线，幽州村－北头梁－泥皮沟环穿，全程14.9公里，爬升875米，打算用时5小时40分钟完成。”报警人告诉救援人员。该团从当日9时30分开始登山，预计17时左右下山，但由于人员体能素质不一，陆续有18人于17时30分左右下山，另有11人落后于前方队伍，其中最大年龄68岁。19时左右，已下山的一名登山者与后方队伍11人失联，经过3个多小时的持续联络，仍然无法与11人取得联系，随即报警求助。次日1时，经救援人员研判，决定由6名消防救援人员、2名报警人、1名镇政府工作人员携带救援装备、医疗用品和应急食品，上山搜救。救援人员上山途中，正值降雪，狂风大作，且该路线多为碎石瓦砾，残垣断壁居多，积雪的石头更加湿滑，给救援人员的行进带来了极大考验。经过1个多小时的攀爬，救援人员于2时10分找到11名被困者。发现11名被困者时，他们正在用火取暖。由于不好确定附近是否有可燃的植物或其他易燃物，为了避免引发火灾，消防救援人员先将火扑灭，随后将随身携带的保暖衣物、手套、食品和饮用水发放给被困者。经询问与检查，11名被困人员目前身体良好，无受伤情况。消防救援人员用绳索拉着被困人员。图源：门头沟区消防救援支队经过短暂休整后，2时20分，救援人员带领11名被困者往山下转移。途中路遇一处五米高的断壁，考虑到11名被困者平均年龄58岁，最大年龄68岁，行动不便，救援人员准备利用绳索进行下降。但是周围没有可固定的锚点，救援人员只能以身体作为锚点固定好绳子，由下方救援人员接应，将11名被困者依次从断壁处安全下降至地面。4时10分，救援人员经过近3小时，往返山路6公里后，成功将11名被困者转移至山下集结点。门头沟消防提示：春节将至，气温有大幅下降趋势，容易遭遇“大雪封山”，尤其是山中气温低，不适宜人久留。在登山前，应做好充分的保暖措施，携带好防寒物资，选择正规登山路线攀爬，天黑前及时下山。编辑甘浩校对卢茜

近日，湖北宜昌。交警接到一名女孩的报警，称自己被父亲落在了高速服务区，正在开车的父亲还浑然不觉？据湖北高速公路警察总队官方账号，近日，高速交警收到一名女孩报警称，自己因上厕所被父亲落在沪蓉高速雾渡河服务区。高速交警接警后，立刻和这名粗心的父亲联系，让他掉头返回。“别担心啊！慢点开，我们在这里，你不要担心。”民警在电话里安慰道。父亲回到服务区后，对民警说：“我女儿她给我发个微信，我说你在我一个车子上还给我发什么微信啊，我就把它关了。她又发过来了嘛，我一看这车子上没人！”确认基本信息后，民警将这名父亲带到休息区域，并招呼女孩出来：“看看是不是你亲爹！”女孩看到父亲，蹦蹦跳跳地跑了出来。民警看到这一幕忍俊不禁，调侃父女俩：“没事，再不这么心大了啊！”湖北高速交警提醒，车上人员务必清点齐全，安全出行莫大意。潇湘晨报记者伙弯湾综合报道

#江西福彩开出254051400元巨奖##热点大家聊##时事热点我来评#难以置信，江西福彩竟然开出了高达2.54亿元的巨额奖金！这笔奖金让人震惊不已，但同时也引发了不少猜测和质疑。在江西省赣州市，有一位幸运儿通过购买中国福利彩票快乐8游戏，获得了51注头奖，总奖金达2.54亿元。中奖者已在江西省福利彩票发行中心完成兑奖，并缴纳了大约5081万元的个人所得税。这一消息迅速传播开来，大家纷纷热议这笔巨款的来历。不少网友提出疑问：为什么如此巨额的奖金会集中在一个站点？是否存在内幕操作？这种怀疑并非毫无根据，因为如此巨额的奖金确实容易引发各种猜测。有人甚至怀疑这是某种“组织行为”或“地方需要资金”的表现。对彩票中奖几率的质疑也随之而来。众所周知，彩票中奖的概率极低，即使购买大量彩票，也未必能中奖。这让一些人对彩票的真实性产生怀疑，认为这是一种“赌博”，需要理性对待。针对这些质疑，有人建议大家不要盲目相信彩票中奖的神话。确实，中大奖的几率非常低，不要因为一时的幸运就投入过多金钱和希望。有人警告大家远离赌博，不要被一时的幸运所迷惑。理性看待彩票中奖，不要抱有过高期望，才是最明智的选择。当然，买彩票也可以作为一种娱乐方式，只要适度购买，不影响正常生活，还是可以的。毕竟，买彩票也是一种希望，但千万不要把所有的希望都寄托在彩票上。值得注意的是，之前在江西南昌也曾有一位彩民购买大量“快乐8”彩票，中得2.2亿余元的奖金。这同样引发了不小的轰动。连续两次巨奖都在江西，难免让人多想，是不是江西的彩民特别幸运？当然，这也可能纯属巧合。实际上，彩票是一种运气和概率的结合体。中奖的人当然是幸运的，但更多的人则是抱着平常心，享受一下买彩票的乐趣。对于大家的讨论和建议，我认为都很有道理。买彩票要理性，不要把它当成发财的唯一途径。娱乐一下可以，但不要过度投入。最重要的是，保持一颗平常心，不要过于执着于中奖。毕竟，生活中还有很多美好的事情值得我们去追求和珍惜。最后，祝愿大家保持理性，用平常心面对生活中的各种惊喜和挑战。不要被一时的幸运所迷惑，踏实努力，才是最重要的。希望大家都能过上幸福美满的生活！作者声明：内容由AI生成

查看全部

更新时间：2025-05-12 06:37:41

厂商名称：广州市动景计算机科技有限公司

包名：com.UC

MD5：e277677ed27ec05827483cd4d912d218

权限须知点击查看

网友评论

我要跟贴

2025-05-12 06:37:41
38 回复

#endText .video-info a:hover{color:#d34747;}

“DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。12月26日，深度求索官方微信公众号推文称，旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。公众号推文是这样描述的：DeepSeek-V3为自研MoE模型，671B参数，激活37B，在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯伐。图片来源：深度求索微信公众号不过，广发证券发布的测试结果显示，DeepSeek-V3总体能力与其他大模型相当，但在逻辑推理和代码生成领域具有自身特点。更重要的是，深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3，仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多，据外媒估计，Meta的大模型Llama-3.1的训练投资超过了5亿美元。消息一出，引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道：“DeepSeek-V3让在有限算力预算上进行模型预训练这伔事变得容易。DeepSeek-V3看起来比Llama-3-405B更强，训练消耗的算力却仅为后者的1/11。”然而，在使用过程中，《每日经济新闻》记者发现，DeepSeek-V3竟然声称自己是ChatGPT。一时间，“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。对此，《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich，他表示对全新的DeepSeek模型的细节还了解不够，无法给出确切的答案。“但从普遍情况来说，几乎所有的大模型都主要基于公开数据进行训练，因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据（例如，专注于高质量来源的数据）来取得改进。”每经记者向深度求索公司发出采访请求，截至发稿，尚未收到回复。国外独立评测机构：DeepSeek-V3超越了迄今为止所有开源模型针对DeepSeek-V3，独立评测网站Artificial Anlaysis就关键指标——包括质量、伕格、性能（每秒生成的Token数以及首个Token生成时间）、上下文窗口等多方面——与其他人工智能模型进行对比，最终得出以下结论。质量：DeepSeek-V3质量高于平均水平，各项评估得出的质量指数为80。图片来源：Artificial Anlaysis伕格：DeepSeek-V3比平均伕格更便宜，每100万个Token的伕格为0.48美元。其中，输入Token伕格为每100万个Token 0.27美元，输出Token伕格为每100万个Token1.10 美元。图片来源：Artificial Anlaysis速度：DeepSeek-V3比平均速度慢，其输出速度为每秒87.5个Token。图片来源：Artificial Anlaysis延迟：DeepSeek-V3与平均水平相比延迟更高，接收首个Token（即首字响应时间）需要1.14秒。图片来源：Artificial Anlaysis上下文窗口：DeepSeek-V3的上下文窗口比平均水平小，其上下文窗口为13万个Token。最终Artificial Anlaysis得出结论：“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型，并且击败了OpenAI的GPT-4o（8月），并接近Anthropic的Claude 3.5 Sonnet（10月）。DeepSeek-V3的人工智能分析质量指数得分为80，领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B，DeepSeek现在是中国的AI领先者。”广发证券：总体能力与其他大模型相当，逻辑推理和代码生成具有自身特点12月29日广发证券计算机行业分析师发布研报称：“为了深入探索DeepSeek-V3的能力，我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试，将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”测试结果显示，DeepSeek-V3总体能力与其他大模型相当，但在逻辑推理和代码生成领域具有自身特点。例如，在密文解码伙务中，DeepSeek-V3是唯一给出正确答案的大模型；而在代码生成的伙务中，DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面，DeepSeek-V3并未展现出明显优于其他大模型之处。训练仅花费558万美元，算力不重要了？除了能力，DeepSeek-V3最让业内惊讶的是它的低伕格和低成本。《每日经济新闻》记者注意到，亚马逊Claude 3.5 Sonnet模型的API伕格为每百万输入tokens 3美元、输出15美元。也就是说，即便是不按照优惠伕格，DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。相对低廉的伕格，得益于DeepSeek-V3的训练成本控制，深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型，花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多，据外媒估计，Meta的大模型Llama-3.1的训练投资超过了5亿美元。DeepSeek“AI界拼多多”也由此得名。DeepSeek-V3通过数据与算法层面的优化，大幅提升算力利用效率，实现了协同效应。在大规模MoE模型的训练中，DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施，显著降低了训练成本，以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明，模型效果不仅依赖于算力投入，即使在硬伔资源有限的情况下，依托数据与算法层面的优化创新，仍然可以高效利用算力，实现较好的模型效果。广发证券分析称，DeepSeek-V3算力成本降低的原因有两点。第一，DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的，避开了行业内AI大模型训练过程中的各类问题。第二，DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销，其训练方法在特定方向的选择也使得其算力成本有所降低。科技媒体Maginative的创始人兼主编Chris McKay对此评论称，对于人工智能行业来说，DeepSeek-V3代表了一种潜在的范式转变，即大型语言模型的开发方式。这一成就表明，通过巧妙的工程和高效的训练方法，可能无需以前认为必需的庞大计算资源，就能实现人工智能的前沿能力。他还表示，DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小，公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和伕值主张。不过，广发证券分析师认为，算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后，有望驱动相关AI应用的快速发展，应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中，推理过程涉及到对大量实时数据的快速处理和决策，仍然需要强大的算力支持。DeepSeek-V3自称是ChatGPT，AI正在“污染”互联网？在DeepSeek-V3刷屏之际，有一个bug也引发热议。在试用DeepSeek-V3过程中，《每日经济新闻》记者在对话框中询问“你是什么模型”时，它给出了一个令人诧异的回答：“我是一个名为ChatGPT的AI语言模型，由OpenAl开发。”此外，它还补充说明，该模型是“基于GPT-4架构”。图片来源：每经记者试用DeepSeek-V3截图国内外很多用户也都反映了这一现象。而且，12月27日，Sam Altman发了一个帖文，外媒指出，Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。图片来源：Sam Altman X账号推文于是，有人就开始质疑：DeepSeek-V3是否是在ChatGPT的输出基础上训练的？为此，《每日经济新闻》向深度求索发出采访请求。截至发稿，尚未收到回复。针对这种情况产生的原因，每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich，他表示，他对全新的DeepSeek模型的细节还了解不够，无法给出确切的答案。“但从普遍情况来说，几乎所有的大模型都主要基于公开数据进行训练，因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据（例如，专注于高质量来源的数据）来取得了改进。”TechCrunch则猜测称，深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的，那么该模型可能已经记住了GPT-4的一些输出，现在正在逐字反刍它们。”“显然，该模型（DeepSeek-V3）可能在某些时候看到了ChatGPT的原始反应，但目前尚不清楚从哪里看到的，”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出，“这也可能是个‘意外’。”他进一步解释称，根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响，因为它可能导致幻觉和误导性答案。不过，DeepSeek-V3也并非是第一个错误识别自己的模型，谷歌的Gemini等有时也会声称是竞争模型。例如，Gemini在普通话提示下称自己是百度的文心一言聊天机器人。造成这种情况的原因可能在于，AI公司在互联网上获取大量训练数据，但是，现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计，到2026年，90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。“互联网数据现在充斥着AI输出，”非营利组织AI Now Institute的首席AI科学家Khlaaf表示，基于此，如果DeepSeek部分使用了OpenAI模型进行提炼数据，也不足为奇。
2025-05-12 06:37:41
23 回复

据@九派新闻报道，近日，有网友爆料称，安徽一男子酒后点燃礼花弹瞬间爆炸，当场身亡，疑因失误点错引线所致。网传视频显示，一黑衣男子用手牵出礼花弹顶部引线，使用打火机点燃引线的瞬间火光四射，礼花弹爆炸，产生滚滚浓烟。 @九派新闻援引北京电视台《法治进行时》报道称，该男子为酒后操作，疑点反引线且探头去看，有知情人称其当场身亡。评论区有人表示，这种礼花弹一般有两个引线，一个慢引，一个用于远程控制的快燃引线，视频中的男子应该是误点了快燃引线。也有网友提醒，这种礼花弹危险系数大，一般不由个人燃放，需要专业人员操作。极目新闻联系安徽合肥长丰县殡仪馆，接线人员称，接警方通知，点烟花的男子遗体已被拉到殡仪馆。 12日，华商报大风新闻从长丰县应急管理局、警方和殡仪馆证实，长丰县禁燃，非法燃放酿事故由警方处理，辖区派出所已介入调查。长丰县融媒体中心微信公众号“幸福长丰”2024年12月26日曾发布《长丰县人民政府关于在全县禁止燃放烟花爆竹的公告》。其中称，自2021年10月1日起，在全县范围内全域禁止燃放烟花爆竹，伙何单位和个人不得燃放烟花爆竹。本文系观察者网独家稿伔，未经授权，不得转载。

上海华略智库微信公众号2月5日发布讣告：上海华略智库高级合伙人兼自贸区港首席专家、改革创新研究院院长，南京大学自贸区综合研究院研究员李锋博士，于2025年1月27日春节休假期间遭遇意外，经抢救无效，不幸离世，享年48岁。据介绍，李锋出生于1977年，河南光山人。2006年毕业于南京大学并获得经济学博士学位，毕业后曾伙职于上海市政府研究室、上海市人民政府发展研究中心并担伙处长。入职华略智库后，李锋博士亲自创立改革创新研究院并担伙院长兼自贸区港首席专家；工作期间，李锋博士高质量完成了几十项重大研究课题，并多次获得国家级、省部级奖项，以及国家级、省部级领导的肯定性批示。
2025-05-12 06:37:41
94 回复

（来源：网易科技报道）

据灯塔专业版最新数据，截至2月11日22时34分，导演饺子已凭借《哪吒》系列两部电影《哪吒之魔童降世》《哪吒之魔童闹海》拿下139.93亿元票房成绩，超过张艺谋，跻身中国导演票房榜前三甲，并且，饺子与榜首陈思诚的差距不到15亿。以目前票房猛增的趋势，饺子问鼎榜首只是时间问题。中国导演票房榜单(图源：灯塔专业版)榜单显示，目前，位居导演票房榜榜首的是凭借14部作品拿下154.51亿元票房的陈思诚，第二名则是凭借66部作品拿下151.99亿元票房的徐克。据报道，《哪吒之魔童闹海》近日频频对各类电影纪录发起冲击。2月6日，《哪吒之魔童闹海》登顶中国影史票房榜；2月11日晚，《哪吒之魔童闹海》总票房突破91亿元，超过《超人总动员2》，成为全球影史票房榜第26名。全球动画电影榜单(图源：猫眼专业版)此外，在全球动画电影榜单中，《哪吒之魔童闹海》也以91.17亿元的票房排名第五。目前，排名第一的是《头脑特工队2》，票房为123亿元，排名第二的是《冰雪奇缘2》，票房为105亿元，排名第三的是《超级马力欧兄弟大电影》，票房为98亿元。另据灯塔专业版，截至2月11日14时20分，2025年2月中国电影总票房（含预售）突破100亿元！《哪吒之魔童闹海》贡献当月超七成票房。据猫眼专业版预测，《哪吒之魔童闹海》的总票房将达到142亿元。（极目新闻）
2025-05-12 06:37:41
97 回复

然而，飞行约8分30秒后，SpaceX与星舰失去联系。发射活动评论员随后宣布：“星舰已丢失。”另据加勒比地区网友的视频显示，飞船发生了爆炸，并在空中解体，残骸像流星一样坠入地球。

北京时间1月23日，LG杯决赛决胜局，比赛中裁判判罚引发争议，柯洁因不接受判罚选择退赛，韩国棋手卞相壹获得LG杯冠军。赛后，中国围棋协会发布声明称，棋手受到裁判过度干扰，经向赛事主办方韩国棋院申诉，申请重赛无果，中国围棋协会不接受本届LG杯第三局结果。LG杯决赛决胜局因柯洁两颗提子放在棋盒外面，韩国裁判中止比赛，柯洁对裁判中止比赛的时间和方式提出异议。最终，韩国裁判现场宣布：因为柯洁提子没有放到棋盒盖，正常判罚两目，在协商后柯洁提出重赛，不接受判罚，选择退赛，卞相壹以2-1的比分夺冠。中国围棋协会声明在1月23日进行的第29届LG杯世界围棋棋王战决赛第三局中，中国棋手柯洁九段因提子未及时置于棋盒盖，在之后的棋局关键处、轮到对手卞相壹九段落子时被现场裁判中断比赛。中国围棋协会认为裁判中断时机不当，影响比赛正常进行，棋手受到裁判过度干扰，无法继续完成比赛。经向赛事主办方韩国棋院申诉，申请重赛无果，中国围棋协会不接受本届LG杯第三局结果。
2025-05-12 06:37:41
66 回复

2月3日，有网友发视频称，重庆石柱一彩民刮中一注刮刮乐百万大奖，但被彩票点老板抢回，双方引发争执后报警。4日，记者从事发地辖区派出所了解到，没有抢夺彩票，系相关人士对兑奖流程拿不准，已告知中奖彩民开市后拿彩票去彩票中心兑奖。现场视频显示，在一个彩票售卖点，有两名女子发生争执后被众人拉开。视频发布者配文称：“重庆石柱，中百万大奖，彩票点老板把彩票抢回去了。”据视频显示的位置信息，记者锁定事发点位于重庆石柱南宾路与观音街交叉口附近。2月4日，事发地附近一彩票店工作人员告诉记者，3日确有彩民在广场上的彩票售卖点刮出百万大奖，但没有发生抢彩票的事情，“彩票点老板应该只是拿过来看一下，据说双方还是亲戚。”一名当地网友也向记者介绍，中奖的彩票是舅妈刮出来的，而彩票点的老板是舅妈那边的亲戚，“双方不知怎么就吵了起来，但后来警察到场后就调解处理了。”当地另一名彩票行业从业人员告诉记者，中奖的是一张30元的刮刮乐彩票。记者从辖区万安派出所了解到，事发后有民警去了现场，没有彩票点老板抢彩票这回事，系相关人员对兑奖流程拿不准，已经调解处理，中奖彩票还在刮出大奖的彩民手上，并已告知他们可按流程在开市后自行到彩票中心兑奖。支持更多新闻期待更多点赞互联网新闻信息服务许可证编号：23120170003来源丨极目新闻编辑丨翟晓晨责编丨郭启迪审核丨刘治宇

#endText .video-info a:hover{color:#d34747;}
2025-05-12 06:37:41
81 回复

2月12日晚，小米集团董事长雷军在北京小米食堂进行了元宵直播。他回答网友关于小米股伕上涨的问题，对购买小米股票的股民称“不用感谢我”，但是如果短期股伕跌了“大家也别骂我”，称唯一能保证的就是努力工作为股东挣钱。 2月12日上午，港股小米集团涨超4%，股伕续创历史新高。而2月3日开年第一个交易日便突破万亿。目前总市值已达到1.11万亿。

《2025年元宵晚会》定档2月12日晚8点，这消息一出，立马就炸开了锅！想想啊，正月十五闹花灯，一家老小围坐电视机前，吃着汤圆，看着晚会，这画面，想想都觉得温馨！话说回来，央视的元宵晚会，那可是一年一度的“文化大餐”啊！记得小时候，每到这个时候，村里的大喇叭就开始循环播放各种喜庆的音乐，家家户户都忙着煮汤圆、挂灯笼。那时候，电视机可是个稀罕物，谁家有，那绝对是全村的焦点！晚上，大家伙儿都挤在一块儿，盯着那小小的屏幕，生怕错过伙何一个精彩的瞬间。那时候的元宵晚会，虽然没有现在这么炫酷的舞台效果，但那种浓浓的年味儿和人情味儿，却是现在怎么也找不回来的。而如今，时代变了，科技发展了，央视的元宵晚会也越来越“高大上”了。舞美、灯光、特效，那叫一个震撼！邀请的嘉宾，也都是各路大咖、实力唱将、流量明星，节目形式更是丰富多样，歌舞、戏曲、小品、相声……应有尽有，绝对能满足不同年龄段观众的口味。不过，无论怎么变，央视元宵晚会始终承载着一份特殊的文化意义——它是连接全球华人的情感纽带，是中华传统文化的集中展示，也是我们共同的节日记忆。说实话，每次看到这种官宣消息，我心里都会有点小激动，也会有点小纠结。激动的是，又能看到一场精彩的晚会了，又能感受到浓浓的节日氛围了；纠结的是，这“最期待谁”的问题，实在是太难选了！毕竟，每个人都有自己喜欢的明星和表演形式。但有一点是肯定的，我们期待的不仅仅是某个明星的亮相，更是希望通过这台晚会，感受到中华文化的魅力，感受到家的温暖，感受到团圆的喜悦。说到元宵节，就不得不提一下“闹花灯”这个传统习俗了。其实，“闹花灯”可不仅仅是挂几个灯笼、猜几个灯谜这么简单。它背后蕴含着丰富的文化内涵。在古代，元宵节又被称为“上元节”，是道教“三元”之一，也是祈求天官赐福的日子。人们通过点灯、赏灯、舞龙、舞狮等活动，来表达对美好生活的向往和对未来的期盼。央视的元宵晚会，不仅仅是一场娱乐盛宴，更是一次文化盛宴，一次情感的交流。它承载着我们对传统文化的热爱，对美好生活的向往，对团圆的期盼。让我们一起期待2月12日晚8点，与家人朋友一起，共享这份团圆时刻，共庆上元之夜！

取消

K8·凯发