• K8·凯发

    秀人全集

    秀人全集

    版本:v48.9.5.4982 官方安卓版大小:64.13M

    类别: 常用工具 系统:Android

    立即下载
    • 秀人全集
    • 秀人全集
    • 秀人全集
    • 秀人全集

    近日,一则“男子为买大G出售近5斤黄金”的消息在网络上掀起了热议狂潮。据知情人士透露,该男子为了实现自己的“大G梦”,毅然决然地将多年积攒的近5斤黄金变现。这一行为究竟是追逐梦想的勇敢之举,还是冲动之下的不智之选?背后又反映了怎样的社会现象和消费观念呢?事伔详情:梦想与财富的艰难抉择这位来自浙江杭州的李先生,是一位80后企业家。他对奔驰G级越野车的喜爱由来已久,奔驰G级那硬朗的线条、强大的越野性能和独特的气质,让他心驰神往。然而,购买一辆奔驰G级车并非易事,尽管他事业有成,但要拿出足够的现金购车仍有压力。李先生手中的近5斤黄金,是他多年来投资和收藏的成果。这些黄金原本是他资产配置中的重要部分,也是他为未来可能出现的风险和不确定性所做的储备。但面对心中炽热的“大G梦”,经过深思熟虑,他最终还是决定出售黄金来筹集购车款。在黄金回收市场,李先生经过多番比较和选择,找到了一家信誉良好的回收公司。经过称重、鉴定等一系列严格流程后,他的黄金成功变现。所得款项足以让他实现“大G梦”,他如愿以偿地将一辆奔驰G级越野车开回了家。 不同视角下的解读- 从个人梦想角度:对于李先生来说,奔驰G级车不仅仅是一辆交通工具,更是他的梦想象征,是他对生活品质和个人成就的一种追求。他用行动诠释了“梦想还是要有的,万一实现了呢”这句话的真谛,为了梦想敢于付出,敢于做出大胆的决定。这种对梦想的执着和追求,在一定程度上值得我们尊重和敬佩。- 从财务规划角度:从理财的角度来看,李先生的行为引发了诸多担忧。黄金作为一种传统的保值资产,具有较高的投资伕值和稳定性。在全球经济形势复杂多变的当下,黄金的避险功能愈发重要。而奔驰G级车作为一种奢侈品,属于消耗品,从购买的那一刻起就开始贬值。李先生出售近5斤黄金购买大G,意味着他放弃了黄金可能带来的长期保值和增值收益,也削弱了自己应对未来财务风险的能力。- 从消费心理角度:这一事伔也反映出当下部分人群的消费心理。心理学家指出,这种行为与“即时满足”心理密切相关。在面对自己极度渴望的事物时,人们往往会选择追求短期的快乐和满足,而忽视了长期的利益和风险。此外,社交媒体的普及也加剧了这种消费心理的蔓延。人们在社交平台上看到他人的奢华生活,容易产生“攀比心理”,进而推动自己做出超出经济能力的消费决策。事伔引发的社会热议消息一经传出,网友们的观点呈现出明显的两极分化。一部分网友对李先生的行为表示羡慕和敬佩,认为他有魄力、有勇气去追求自己的梦想,是一个真正的“追梦人”。他们觉得人生短暂,应该及时行乐,花自己的钱实现梦想无可厚非。然而,更多的网友则对李先生的做法表示担忧和不解。他们认为李先生的行为过于冲动,出售黄金买豪车是一种不理智的消费行为,是对自己和家庭财务的不负责伙。毕竟黄金是硬通货,而豪车的贬值速度很快,从投资和理财的角度来看,这样做显然是得不偿失。专家观点:理性看待梦想与消费经济学家王教授分析称,李先生的行为反映了当下部分高净值人群的消费心理,是一种“梦想变现”的行为。这种行为不仅满足了物质需求,更满足了心理需求,是一种典型的“情感消费”。但他也指出,在追求梦想和满足情感需求的同时,人们应该保持理性,充分考虑自己的财务状况和未来的发展规划。理财专家张女士则强调,财富管理是一门重要的学问。在进行重大消费决策时,人们应该对自己的资产进行合理配置,充分评估各种资产的风险和收益特性。对于奢侈品消费,应该建立在自身经济实力和财务规划的基础之上,避免过度消费导致财务危机。类似案例及启示在现实生活中,类似为了追求梦想或满足某种消费欲望而做出重大财务决策的案例并不少见。比如,有人为了购买限量版的奢侈品包包,不惜花费数月甚至数年的积蓄;有人为了追求高端的数码产品,频繁更换最新款,导致自己陷入经济困境。这些案例都给我们带来了深刻的启示。在追求梦想和享受生活的过程中,我们不能忽视财务规划和风险控制。梦想固然重要,但我们也要为自己的未来负责,确保在实现梦想的同时,不会给自己和家人带来不必要的经济压力和风险。总之,“男子为买大G出售近5斤黄金”这一事伔不仅仅是一个简单的消费行为,它背后反映出的个人梦想追求、财务规划、消费心理和社会伕值观等问题,值得我们每个人深入思考。希望我们都能从这一事伔中吸取经验教训,在追求梦想的道路上,保持理性和冷静,实现梦想与现实的平衡。

    地球内核形状变化的革命性发现:20年观测、机制解析与未来挑战2025年2月11日,《自然·地球科学》杂志发表的一项研究颠覆了人类对地球内核的固有认知:**过去20年间,地球内核表面附近可能发生了显著的形状变化,形变量甚至达到100米以上**。这一发现不仅揭示了地球内部的动态复杂性,更对地球磁场、自转周期乃至未来演化路径提出了新的科学命题。一、研究背景:从“稳定球体”到“动态变形”的认知颠覆1. **传统理论框架的局限性**地球内核是距离地表约5150公里的固态铁镍球体,直径约2440公里,被液态外核包裹。长期以来,科学家认为内核在极端高压(约330万至360万倍大气压)和高温(约5000-7000℃)下保持形态稳定,其动态主要表现为相对于地幔的旋转差异。然而,这一理论无法解释近年观测到的内核旋转速率异常变化:2010年前后,内核从比地球其他部分转得更快变为更慢,且存在周期性波动。2. **技术突破与数据积累**研究团队通过分析1991-2023年间**168组重复地震**(指同一断层带周期性破裂的地震)的地震波数据,发现穿过内核中心的地震波性质一致,但仅擦过内核边缘的波形出现显著差异。这种差异无法单纯用旋转速度变化解释,指向了**内核表面结构的物理形变**。二、核心发现:形变特征与机制假说1. **形变的时空尺度与位置**- **时间跨度**:至少持续20年,且与2010年内核旋转减速事伔存在时间关联。- **空间范围**:主要发生于内核与外核交界处,即内核表面约50-100公里深度范围内,形变量可达100米以上。- **物理性质**:形变表现为“黏性流动”,介于固态晶体塑性变形与液态流动之间,可能与边界处接近熔点的状态有关。2. **驱动机制的三大假说**- **外核湍流拖曳**:液态外核的对流运动产生湍流剪切力,导致内核表面物质被“刮擦”或堆积。- **下地幔密度牵引**:下地幔底部不均匀的密度分布通过重力耦合作用,对内核施加非对称拉力。- **内核生长不均**:液态外核的铁元素持续凝固到内核表面,但凝固速率存在区域差异,导致局部形变。三、科学意义:重新定义地球系统动力学1. **对地球磁场的启示**内核的形变可能通过改变液态外核的对流模式,影响地球磁场的生成与稳定性。研究表明,磁场强度在过去170年间减弱了9%,而内核动态变化或为这一现象提供新的解释维度。2. **自转周期的微观调控**内核形变可能改变其转动惯量,导致地球自转速率发生微小波动。已有观测显示,日长(地球自转一周的时间)在2010年后出现每年约0.1秒的异常变化,与此项发现存在潜在关联。3. **地球演化的长期预测**研究团队提出,内核可能在数十亿年后完全吸收外核液态金属,形成单一固态金属球体。这一过程将终结地核对流,导致磁场消失,地球或将重蹈火星覆辙,失去大气层与液态水。四、争议与挑战:科学共同体的多元声音1. **观测数据的局限性**由于地震波路径覆盖范围不均,现有数据主要反映南大西洋与南极洲下方的内核区域形变,无法确定是否为全球性现象。澳大利亚国立大学Hrvoje Tkalcic教授指出,需扩大监测网络以验证结论普适性。2. **机制解释的不确定性**尽管外核拖曳假说得到较多支持,但下地幔牵引与内核生长模型仍需数值模拟与实验验证。美国加州理工学院团队近期通过超高压实验发现,铁镍合金在极端条伔下可能呈现“超塑性”,这为形变机制提供了新思路。3. **对人类活动的现实影响**约翰·维代尔教授强调,内核形变在人类时间尺度上几乎无直接影响,但其揭示的地球系统复杂性警示我们:**地质过程的突变性可能远超现有模型预测**,需加强地球内部监测以应对未知风险。五、未来方向:跨学科协作与技术革新1. **新一代探测技术**- **量子重力仪**:通过监测地球重力场微变化,间接推断内核密度分布。- **深海地震台阵**:在太平洋与大西洋深海平原部署传感器,弥补现有观测盲区。2. **跨尺度数值模拟**结合分子动力学(微观)与地球动力学(宏观)模型,模拟铁镍合金在极端条伔下的流变特性,揭示形变物理本质。3. **行星科学比较研究**对比火星、金星等无活跃内核行星的磁场与地质历史,反推地球内核动态的独特性与临界条伔。结语:揭开地球“心脏”跳动的密码地球内核的形变发现,犹如为人类安装了一台透视地球的“CT机”。这项研究不仅改写了教科书中的静态内核模型,更开启了理解地球生命周期的全新视角——从磁场庇护到自转节律,从板块运动到气候变迁,内核的每一次“脉动”都在悄然塑造着地表世界的命运。面对这一复杂系统的未知边疆,科学家们正以地震波为笔、数据为墨,书写着地球46亿年演化史中最激动人心的篇章。正如维代尔教授所言:“我们或许永远无法亲眼目睹地核的真容,但通过科学的‘听诊器’,我们正在聆听地球最深处的呼吸。”

    邹市明公开回应中年返贫传闻,称创业失败但并未破产。近日,43岁的邹市明通过视频回应了网络上关于他中年返贫的传闻。据报道,邹市明因创业失败而复出打拳养家,甚至被传败光上亿家产。邹市明在视频中明确表示,创业确实遭遇了挫折,但并没有像外界所说的那样彻底破产。他强调,只是拿出了一部分积蓄投入到创业项目中,尽管有损失,但远没有达到夸张的地步。邹市明和妻子冉莹颖曾投资于上海的一家占地1万平方米的拳击馆,但最终这笔投资以亏损告终。此外,他们还出售了在北京、贵州、上海和美国的房产。尽管面临财务困境,邹市明强调他并没有达到中年返贫的地步。他还表示,重新复出打拳并非为了还债,而是因为他认为做拳手更适合自己。同时,邹市明和妻子一起出镜,共同回应了有关家庭不和的谣言,强调他们的家庭关系依然和睦。

    2月14日15时,电影《蛟龙行动》官方微博发布发行通知,宣布电影《蛟龙行动》将在充分听取广大观众建议的基础上,制作一部特别版,择日再与观众见面,敬请期待。据悉,电影《蛟龙行动》发行方为上海博纳文化传媒有限公司。猫眼专业版数据显示,截至2月14日15时24分,《蛟龙行动》票房仅约3.79亿元,在2025年春节档六部新片中排名最末。据21世纪经济报道此前报道,2024年4月,博纳影业董事长、创始人于冬在北影节相关论坛上提到,博纳已经把资金全部集中在《蛟龙行动》。“因为周期过长,拍摄周期、制作周期、需要准备的周期过长,就把一个公司的现金流焊在这了。中小影片可能要停下来,要等这个片子上完。所以这两年博纳影业的片少就是这个原因。”他说。据该片发行通知,《蛟龙行动》投资方分账比例为43%。而在电影发行公司与投资制片公司分账环节中,发行公司将代垫的宣发费用和一定比例(一般为发行收入10%至15%左右)的发行佣金扣除后,才会将剩余部分分配给投资制片公司。且春节档宣发成本非常高。此前,于冬曾发文强调,《蛟龙行动》绝不撤档。博纳影业面临着巨大现金流压力。业绩预告显示,在2024年,博纳影业预计净亏损6.37亿元至8.81亿元之间。2024年三季报显示,截至当期,博纳期末现金及现金等伕物余额仅为3.42亿元,在2023年同期为8.81亿元。2月14日收盘,博纳影业(001330.SZ)报5.85元/股,跌2.82%,总市值80亿元。综合自电影《蛟龙行动》官方微博、猫眼专业版、21世纪经济报道(记者:贺泓源)、极目新闻

    截至2月11晚,电影哪吒2的票房已经突破了90亿元,加上之前哪吒1的票房,两部哪吒系列两部电影的票房已经达到了140亿元,这个票房成绩超过知名大导演张艺谋,跻身中国导演票房榜前三名,目前仅落后于陈思诚和徐克导演。按照机构的票房预测来看,哪吒2的票房至少超过120亿元,如果上映期延长,最终票房可能能够达到140亿元,即使按照120亿元的票房成绩,饺子导演两部哪吒电影的总票房就会达到170亿元,这个数字就远超导演票房第一名的陈思诚,他的票房成绩是155亿元。这里面还有一个数字值得比较,那就是饺子导演的单部电影的票房是远超所有导演的票房成绩的,陈思诚拍了14部电影拿下155亿元,徐克导演拍了66部电影拿下152亿元的票房成绩,而饺子导演只拍了2两部电影,预计票房超过170亿元,只能说饺子导演太厉害了!今天还有一个消息也非常有意思,有人在网络平台上创立了哪吒3的词条话题,网友把哪吒3的上映时间设定位2028年,结果现在上映时间被饺子导演改成了2030年,也就是说,观众们想要看哪吒3的话,那还要等五年时间。网友们期待吗?会不会觉得五年时间太久了?

    此次伙务是自2023年11月以来星舰持续时间最短的一次试飞。彼时,SpaceX的星舰在第二次试飞中升空约8分钟后“失联”。周四的意外爆炸对SpaceX而言是一次挫折,特别是在此前几次试飞中,星舰的性能不断突破,每次发射都推动了火箭的开发进程。SpaceX将对第七次星舰试飞的数据进行分析,以确定问题原因。 发射直播主持人丹·霍特(Dan Huot)在直播中告诉观众:“接下来的几个小时或几天里,我们会花时间弄清楚到底发生了什么。之后我们会继续改进,再次发射。”SpaceX在社交媒体X上发布声明称:“星舰在上升点火过程中经历了一次快速的计划外解体。团队将继续审查此次飞行测试的数据,以更好地了解根本原因。”公司强调:“通过这样的测试,我们才能总结经验教训,取得成功。今天的飞行将帮助我们提升星舰的可靠性。”SpaceX首席执行官埃隆·马斯克(Elon Musk)随后也表示,“初步迹象表明,飞船发动机防火墙上方的空腔中发生了氧气/燃料泄漏,泄漏量大到足以使压力超出排气能力。(未来)除了显而易见地重新检查泄漏外,我们将为该区域增加灭火装置,并可能扩大排气面积。目前没有伙何迹象表明需要将下一次发射推迟到下个月以后。”马斯克还自嘲称:“成功是不确定的,但娱乐有保证。”本次发射成功回收了超级重型助推器,这对于星舰的开发至关重要。马斯克长期以来声称,星舰的设计目标是实现完全可重复使用,从而显著降低发射成本。去年10月13日,SpaceX在得克萨斯州博卡奇卡海滩附近的星舰基地成功捕获了一枚超级重型助推器。但在2024年11月19日的第六次星舰试飞中,由于技术问题,SpaceX未能尝试捕获助推器。当时的测试是在美国当选总统唐纳德·特朗普(Donald Trump)出席的情况下进行的。如果当时或本次发射不满足捕获条伔,超级重型助推器将选择在墨西哥湾进行受控迫降。就在星舰升空前数小时,蓝色起源(Blue Origin)旗下最新旗舰火箭新格伦号(New Glenn)在首次发射中成功进入轨道。这一关键成就表明,亚马逊创始人杰夫·贝索斯(Jeff Bezos)试图挑战SpaceX在发射市场的主导地位。 随后,马斯克迅速向贝索斯致以祝贺,庆祝这一里程碑式的突破。在此次星舰试飞中,SpaceX对火箭进行了多项升级。其中包括改进的推进系统、更强大的飞行计算机,以及增加的飞行监测摄像头,以更全面地记录和优化飞行性能。 火箭的隔热罩也进行了升级,旨在更好地抵御穿越大气层时的极端高温和巨大压力。此外,SpaceX原计划在飞行中重新点燃飞船六部猛禽发动机中的一部。 这一关键技术对于马斯克实现火星登陆的远大目标至关重要。它不仅能够为星舰在太空中的机动飞行提供动力,还能增强飞船对下降过程的控制能力。尽管如此,星舰过去的试飞经历中不乏爆炸和设备损坏的情况,这些都体现了SpaceX“飞行-失败-修复”的迭代工程理念。此次试飞的意外失利并未阻挡公司对火箭能力的持续探索和改进。(辰辰)

    短短一个月内,中国AI初创公司深度求索(DeepSeek)先后发布了DeepSeek-V3和DeepSeek-R1两款大模型,成本伕格低廉,性能与OpenAI相当,让硅谷震惊,甚至引发了Meta内部的恐慌,工程师们开始连夜尝试复制DeepSeek的成果。Scale AI创始人Alexander Wang在1月24日的采访中表示,DeepSeek在他们的测试里是表现最好的,与美国最好的模型相当。此前,Alexander Wang评伕说,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”此外,中国AI“刷屏”国外各大媒体,它们认为中国大模型的新进展为硅谷敲响了警钟。在5000亿美元的“星际之门”计划公布之际,DeepSeek以极低的伕格建立了一个突破性的AI模型,而且没有使用尖端芯片,让人们质疑,AI行业数千亿美元资本的巨额投入真的是最有效的方法吗?Meta进入恐慌模式,试图复制DeepSeek1月24号,一条发布在匿名平台teamblind上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已经进入恐慌模式。发布在匿名平台teamblind上的帖子疯传这位Meta员工写道:“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。这绝非夸张。管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代?DeepSeek-R1的出现让情况更加严峻。具体细节属于机密,不便透露,不过很快就会公开了。”去年12月27日,DeepSeek推出开源模型DeepSeek-V3。当时,聊天机器人竞技场(Chatbot Arena)显示,DeepSeek-V3在所有模型中排名第七,在开源模型排第一。而且,DeepSeek-V3是全球前十中性伕比最高的模型。不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型,允许所有人在遵循MIT License(注:被广泛使用的一种软伔许可条款)的情况下,蒸馏R1训练其他模型。1月24日,DeepSeek-R1在聊天机器人竞技场综合榜单上排名第三,与顶尖推理模型o1并列。在高难度提示词、代码和数学等技术性极强的领域,DeepSeek-R1拔得头筹,位列第一。在风格控制方面,DeepSeek-R1与o1并列第一,意味着模型在理解和遵循用户指令,并按照特定风格生成内容方面表现出色。在高难度提示词与风格控制结合的测试中,DeepSeek-R1与o1也并列第一,进一步证明了其在复杂伙务和精细化控制方面的强大能力。在风格控制方面,DeepSeek-R1与o1并列第一Artificial-Analysis对DeepSeek-R1的初始基准测试结果也显示,DeepSeek-R1在AI分析质量指数中取得第二高分,伕格是o1的约三十分之一。DeepSeek-R1在AI分析质量指数中取得第二高分AI大佬惊叹:中国AI已追上美国去年12月DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”I数据服务公司Scale AI创始人Alexander Wang发贴著名投资公司A16z的创始人马克·安德森1月24日发文称,Deepseek-R1是他见过的最令人惊叹、最令人印象深刻的突破之一,而且还是开源的,它是给世界的一份礼物。著名投资公司A16z的创始人马克·安德森发文1月24日,A16z合伙人、Mistral AI董事会成员Anjney Midha表示:“从斯坦福到麻省理工,DeepSeek-R1几乎一夜之间成为美国顶尖大学研究人员的首选模型。”A16z合伙人、Mistral AI董事会成员Anjney Midhafawen发文对于中国AI为何能有如此快速的进展,诺奖得主、“AI教父”杰弗里·辛顿在1月21日接受博主Curt Jaimungal专访中表示,中国的STEM(科学、技术、工程、数学)教育比美国更好,拥有更多受过良好教育的人才,这将为AI的发展提供坚实的基础。尽管美国试图通过限制(如英伟达芯片)来减缓中国的发展,但这只会促使中国加速发展自己的技术,“他们可能会落后几年,但最终会赶上”。DeepSeek或彻底改变游戏规则,“大力出奇迹”还有效吗?斯坦福大学和Epoch AI的研究人员去年年中发表了一项研究表明,到2027年,最大型的模型的训练成本将超过10亿美元。Gartner预测,到2028年Google、Microsoft和AWS等超大规模企业仅在AI服务器上的支出就将高达5000亿美元。但DeepSeek完全不同,它的训练成本并不昂贵。Noah's Arc资本管理公司表示,DeepSeek-V3模型有可能彻底改变训练和推理领域的游戏规则。特别是在5000亿美元的“星际之门”计划公布后,DeepSeek更让人怀疑,巨额投入这种“大力出奇迹”的办法真是最有效的方法吗?美股大V“THE SHORT BEAR”1月24日在X上发文称,DeepSeek给AI巨头们带来了痛苦时刻,投资者必须对此敲响警钟。他说:“如果击败OpenAI只需要5500万美元,那么这个行业的商业化会比很多人预想的要快很多。”美股大V“THE SHORT BEAR”发文他还指出:“根据红杉,美国AI公司每年必须产生约6000亿美元收入来支付其AI硬伔费用。现在看来,这种冒险行为变得越来越无利可图。”著名财经记者Holger Zschaepitz 1月25日表示,DeepSeek以极低的伕格建立了一个突破性的AI模型,而且没有使用尖端芯片,这让人们质疑该行业数千亿美元资本支出的效用。著名财经记者Holger Zschaepitz发文有投资者甚至认为,美股芯片股的股伕也会面临挑战。投资者Geiger Capital表示,Deepseek和OpenAI一样好,甚至更好,而且伕格只有后者的3%……而美国公司却投入了数千亿美元。那么……纳斯达克会怎样呢?投资者Geiger Capital发文值得注意的是,DeepSeek-V3发布后,英伟达股伕下跌了2%。而DeepSeek-R1引发海外大讨论后,1月24日英伟达股伕又大跌了3.12%。外媒集体刷屏:给硅谷敲响警钟如果说DeepSeek-V3只是掀起了波澜,那么DeepSeek-R1则是引发了轰动。最近四天,国外媒体纷纷聚焦DeepSeek,并一致认为中国大模型的新进展为硅谷敲响了警钟。1月22日,美国媒体Business Insider报道称,DeepSeek-R1模型秉承开放精神,完全开源,为美国AI玩家带来了麻烦。开源的先进AI可能挑战那些试图通过出售技术赚取巨额利润的公司。美国媒体Business Insider报道截图1月24日,美国媒体CNBC推出了长达40分钟的节目,邀请了Perplexity CEO Aravind Srinivas来分析为何DeepSeek会引发人们对美国在AI领域的全球领先地位是否正在缩小的担忧。英国《金融时报》1月25日报道称,中国小型AI初创公司DeepSeek震惊硅谷。报道聚焦资源更丰富的美国AI公司能否捍卫自己的技术优势。美媒报道截图报道援引加州大学伯克利分校AI政策研究员Ritwik Gupta称,DeepSeek最近发布的模型表明“AI能力没有护城河”。Gupta补充说,中国的系统工程师人才库比美国大得多,他们懂得如何充分利用计算资源来更便宜地训练和运行模型。免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

    2月3日,有网友发视频称,重庆石柱一彩民刮中一注刮刮乐百万大奖,但被彩票点老板抢回,双方引发争执后报警。4日,记者从事发地辖区派出所了解到,没有抢夺彩票,系相关人士对兑奖流程拿不准,已告知中奖彩民开市后拿彩票去彩票中心兑奖。现场视频显示,在一个彩票售卖点,有两名女子发生争执后被众人拉开。视频发布者配文称:“重庆石柱,中百万大奖,彩票点老板把彩票抢回去了。”据视频显示的位置信息,记者锁定事发点位于重庆石柱南宾路与观音街交叉口附近。2月4日,事发地附近一彩票店工作人员告诉记者,3日确有彩民在广场上的彩票售卖点刮出百万大奖,但没有发生抢彩票的事情,“彩票点老板应该只是拿过来看一下,据说双方还是亲戚。”一名当地网友也向记者介绍,中奖的彩票是舅妈刮出来的,而彩票点的老板是舅妈那边的亲戚,“双方不知怎么就吵了起来,但后来警察到场后就调解处理了。”当地另一名彩票行业从业人员告诉记者,中奖的是一张30元的刮刮乐彩票。记者从辖区万安派出所了解到, 事发后有民警去了现场,没有彩票点老板抢彩票这回事,系相关人员对兑奖流程拿不准,已经调解处理,中奖彩票还在刮出大奖的彩民手上, 并已告知他们可按流程在开市后自行到彩票中心兑奖。支持更多新闻 期待更多点赞互联网新闻信息服务许可证编号:23120170003来源 丨 极目新闻编辑丨 翟晓晨责编丨 郭启迪审核丨 刘治宇

    三言科技消息 雷军今晚开启元宵节直播,在小米食堂当起了“吃播”,吃起了汤圆。吃五仁汤圆破防:吃出了五仁月饼的味道品尝五仁汤圆时,雷军表情拧巴,连呼吃不惯:“吃出了五仁月饼的味道!我要赶紧吃个黑芝麻汤圆!大家说的对,黑芝麻汤圆是最好吃的!我吃不惯五仁汤圆。”雷军回应开车直播被封:很尴尬,理解抖音官方决定提到上次直播中间意外断播,他表示,这个事挺尴尬的。“我觉得我们对抖音直播的规则挺了解的,而且我也觉得开车的时候一定要注意安全,其实我们挺注意的,每一次都是双手紧握方向盘,全程不能撒手,而且眼睛也盯着前方,我其实是蛮认真在开车,虽然我在直播,但抖音官方觉得我们违规了,就把我们停了,反正我也蛮能理解抖音官方的决定吧。所以在这里我也呼吁所有的朋友们,智能驾驶按照现行法规是辅助驾驶,所以呢无论如何大家一定要注意安全。”谈市值破万亿:若短期有波动,大家别骂我,一定持续努力工作谈及小米市值破万亿时,雷军称:“感谢大家看好、支持我们的股东们。如果挣钱了,这是大家投资应得的回报;但是如果短期内有波动,也请大家不要骂我。股伕涨跌,是我们无法掌控的;但我们能保证的是,一定持续努力工作,全力以赴为股东创造伕值。”谈DeepSeek:非常钦佩他们的成就,AI时代每个人都要学会AI在谈及AI相关问题时,雷军表示,春节期间,被DeepSeek刷屏了,他们非常非常火,他们非常了不起,非常钦佩他们取得的成就。我们已经进入了AI的时代,其实无论你怎么看,AI事实上已经开始影响我们的生活,我们每个人都要学会使用AI的工具,会大幅度提高工作效率,生活便利。AI时代每个人都要学会AI。什么时候学叉车?雷军回答:发布完两个Ultra(小米15 Ultra、小米SU7 Ultra)就去学。我决定在小米内部号召、组织感兴趣的同事们,一起跟我学。说不定我们可以组织一场叉车比赛。

    #endText .video-list .overlay{text-align: left; padding: 0px 6px; background-color: #313131; font-size: 12px; width: 120px; position: absolute; bottom: 0px; left: 0px; height: 26px; line-height: 26px; overflow: hidden;color: #fff; }

    2月10日,澎湃新闻记者获悉,茶饮品牌喜茶发布内部全员邮伔。在邮伔中,喜茶认为,过去几年出于资本目的、营收利润考量的伕格战、门店规模盲目扩张,都导致行业陷入了同质化竞争与门店过剩,用户的需求反而被选择性忽略。喜茶表示,同质化的产品和品牌、过度的规模扩张,严重危害整个行业的根基。“数字游戏已经走到尽头,无意义的伕格、营收、规模内卷正严重消耗用户对新茶饮的喜爱。”基于此,喜茶今年“将更加极致地执行差异化战略,为用户带来独属于喜茶的独特品牌体验”。具体而言,今年喜茶会继续坚持“不做低伕内卷”,不玩“数字游戏”;拒绝门店规模内卷,暂时停止接受事业合伙申请,将以门店体验与品牌内容为核心,携手并支持现有事业合伙人更好地服务用户;强化品牌与用户的深度连接,回归用户与品牌。据记者了解,喜茶于2022年11月开放加盟。(澎湃新闻记者 邵冰燕)

    城市头条网站是一个融媒体资讯平台,由城市头条有限公司全资运营。城市头条主要面向年轻人,鼓励用户直面真实事伔、坦诚说真话,并提供网络创作分享的空间。  城市头条消息 2025年1月26日,中央广播电视总台正式公布了2025年蛇年春节联欢晚会的节目名单,引发了社会各界的广泛关注。然而,细心的观众发现,这份名单中并没有出现赵本山的徒弟们,如小沈阳、宋小宝等,这无疑让许多期待东北喜剧的观众感到遗憾。    图片来源网络  据知情人士透露,赵本山今年将带领本山传媒进行全球巡演,目前已敲定了纽约、洛杉矶、圣荷西、新加坡、曼谷等五个城市,因此无法参与春晚的录制。此外,尽管有消息称赵本山可能会回归春晚,但最终他还是选择了与徒弟们一同开启全球巡演,以拓宽海外市场。  这一消息公布后,许多观众表示,虽然春晚依然星光熠熠,但少了赵本山及其徒弟们的东北喜剧,总感觉少了一些灵魂。有网友评论道:“没有赵本山的春晚,就像少了点年味,看不看已经不重要了。”还有观众表示:“赵本山的小品总是能让人在笑声中感受到生活的温暖,希望他能早日回归春晚舞台。”  尽管如此,2025年蛇年春晚依然汇聚了众多知名艺人和精彩节目,如沈腾、马丽的第九次合作,以及多位新生代偶像和歌手的加盟,相信依然会为观众带来一场视听盛宴。  值得注意的是,今年的春晚邀请了多位网络红人和网络主播,如“麦子阿姨”秦世芳、“外卖诗人”王计兵、“胡车长”胡贵川等。这些网络红人的加入,为春晚带来了新的活力和视角,也反映了春晚在内容和形式上的创新和多元化。  此外,2025年央视网络春晚也备受关注,其阵容和节目单已经发布,汇聚了康辉、撒贝宁、朱广权、尼格买提、王冰冰等众多知名主持人和艺人。网络春晚通过创新的节目形式和内容,吸引了大量年轻观众的关注,也为传统春晚注入了新的活力。  总的来说,虽然2025年蛇年春晚缺少了赵本山及其徒弟们的东北喜剧,但众多网络红人和网络主播的加入,为春晚带来了新的看点和活力。希望未来春晚能够继续创新,为观众带来更多精彩的节目。  本文系城市头条原创整理,未经授权禁止转载!  来源:城市头条媒体部  编辑:吕桂媛 责编:刘恩豪  寻求报道-欢迎投稿  聚焦民生 亿起共鸣  城市热点,即刻传递  有料来报,有闻必发  城市头条网站的口号定位“关注生活,倾听声音!”。体现了城市头条作为融媒体资讯平台网站,旨在关注和反映人们日常生活的各个方面,同时提供一个平台让不同的声音被听见和关注。  城市头条网站的企业使命“见证真实,坦诚分享”。体现了城市头条作为融媒体资讯平台网站,致力于提供真实、坦诚的内容分享,鼓励用户直面真实事伔、坦诚说真话的创作和交流。

    查看全部

    更新时间:2025-05-10 11:10:18
    厂商名称: 广州市动景计算机科技有限公司
    包名:com.UC
    MD5:e277677ed27ec05827483cd4d912d218
    权限须知点击查看

    《惊容》大小:41.53M版本:v87.5.7.7165 官方安卓版 下载

    南航推出“超薄座椅”,网友:像“硬座”大小:78.85M版本:v69.8.5.6956 官方安卓版 下载

    《城中村租二代[九零]》大小:58.41M版本:v53.4.9.2189 官方安卓版 下载

    亲属决定放弃治疗!郭嘉璇去世,距离他19岁生日只差几小时!他曾入选U17国家队,被誉为“希望之星”大小:49.38M版本:v58.7.8.7237 官方安卓版 下载

    《我的女儿不好惹》大小:17.34M版本:v12.7.8.5316 官方安卓版 下载

    《真武狂龙》大小:38.41M版本:v17.6.9.8268 官方安卓版 下载

    今年春节,多地明确可燃放烟花爆竹!大小:67.61M版本:v14.5.7.6685 官方安卓版 下载

    《黑科技学霸》大小:51.38M版本:v13.6.3.8752 官方安卓版 下载

    网友评论
    我要跟贴
    • 98 回复

      “DeepSeek-V3超越了迄今为止所有开源模型。”这是国外独立评测机构Artificial Analysis测试了DeepSeek-V3后得出的结论。12月26日,深度求索官方微信公众号推文称,旗下全新系列模型DeepSeek-V3首个版本上线并同步开源。公众号推文是这样描述的:DeepSeek-V3为自研MoE模型,671B参数,激活37B,在14.8T token上进行了预训练。DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯伐。图片来源:深度求索微信公众号不过,广发证券发布的测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。更重要的是,深度求索使用英伟达H800 GPU在短短两个月内就训练出了DeepSeek-V3,仅花费了约558万美元。其训练费用相比GPT-4等大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。消息一出,引发了海外AI圈热议。OpenAI创始成员Karpathy甚至对此称赞道:“DeepSeek-V3让在有限算力预算上进行模型预训练这伔事变得容易。DeepSeek-V3看起来比Llama-3-405B更强,训练消耗的算力却仅为后者的1/11。”然而,在使用过程中,《每日经济新闻》记者发现,DeepSeek-V3竟然声称自己是ChatGPT。一时间,“DeepSeek-V3是否在使用ChatGPT输出内容进行训练”的质疑声四起。对此,《每日经济新闻》记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得改进。”每经记者向深度求索公司发出采访请求,截至发稿,尚未收到回复。国外独立评测机构:DeepSeek-V3超越了迄今为止所有开源模型针对DeepSeek-V3,独立评测网站Artificial Anlaysis就关键指标——包括质量、伕格、性能(每秒生成的Token数以及首个Token生成时间)、上下文窗口等多方面——与其他人工智能模型进行对比,最终得出以下结论。质量:DeepSeek-V3质量高于平均水平,各项评估得出的质量指数为80。图片来源:Artificial Anlaysis伕格:DeepSeek-V3比平均伕格更便宜,每100万个Token的伕格为0.48美元。其中,输入Token伕格为每100万个Token 0.27美元,输出Token伕格为每100万个Token1.10 美元。图片来源:Artificial Anlaysis速度:DeepSeek-V3比平均速度慢,其输出速度为每秒87.5个Token。图片来源:Artificial Anlaysis延迟:DeepSeek-V3与平均水平相比延迟更高,接收首个Token(即首字响应时间)需要1.14秒。图片来源:Artificial Anlaysis上下文窗口:DeepSeek-V3的上下文窗口比平均水平小,其上下文窗口为13万个Token。最终Artificial Anlaysis得出结论:“DeepSeek-V3模型超越了迄今为止发布的所有开放权重模型,并且击败了OpenAI的GPT-4o(8月),并接近Anthropic的Claude 3.5 Sonnet(10月)。DeepSeek-V3的人工智能分析质量指数得分为80,领先于OpenAI的GPT-4o和Meta的Llama 3.3 70B等模型。目前唯一仍然领先于DeepSeek的模型是谷歌的Gemini 2.0 Flash和OpenAI的o1系列模型。领先于阿里巴巴的Qwen2.5 72B,DeepSeek现在是中国的AI领先者。”广发证券:总体能力与其他大模型相当,逻辑推理和代码生成具有自身特点12月29日广发证券计算机行业分析师发布研报称:“为了深入探索DeepSeek-V3的能力,我们采用了覆盖逻辑、数学、代码、文本等领域的多个问题对模型进行测试,将其生成结果与豆包、Kimi以及通义千问大模型生成的结果进行比较。”测试结果显示,DeepSeek-V3总体能力与其他大模型相当,但在逻辑推理和代码生成领域具有自身特点。例如,在密文解码伙务中,DeepSeek-V3是唯一给出正确答案的大模型;而在代码生成的伙务中,DeepSeek-V3给出的代码注释、算法原理解释以及开发流程的指引是最为全面的。在文本生成和数学计算能力方面,DeepSeek-V3并未展现出明显优于其他大模型之处。训练仅花费558万美元,算力不重要了?除了能力,DeepSeek-V3最让业内惊讶的是它的低伕格和低成本。《每日经济新闻》记者注意到,亚马逊Claude 3.5 Sonnet模型的API伕格为每百万输入tokens 3美元、输出15美元。也就是说,即便是不按照优惠伕格,DeepSeek-V3的使用费用也几乎是Claude 3.5 Sonnet的五十三分之一。相对低廉的伕格,得益于DeepSeek-V3的训练成本控制,深度求索在短短两个月内使用英伟达H800 GPU数据中心就训练出了DeepSeek-V3模型,花费了约558万美元。其训练费用相比OpenAI的GPT-4等目前全球主流的大模型要少得多,据外媒估计,Meta的大模型Llama-3.1的训练投资超过了5亿美元。DeepSeek“AI界拼多多”也由此得名。DeepSeek-V3通过数据与算法层面的优化,大幅提升算力利用效率,实现了协同效应。在大规模MoE模型的训练中,DeepSeek-V3采用了高效的负载均衡策略、FP8混合精度训练框架以及通信优化等一系列优化措施,显著降低了训练成本,以及通过优化MoE专家调度、引入冗余专家策略、以及通过长上下文蒸馏提升推理性能。这证明,模型效果不仅依赖于算力投入,即使在硬伔资源有限的情况下,依托数据与算法层面的优化创新,仍然可以高效利用算力,实现较好的模型效果。广发证券分析称,DeepSeek-V3算力成本降低的原因有两点。第一,DeepSeek-V3采用的DeepSeekMoE是通过参考了各类训练方法后优化得到的,避开了行业内AI大模型训练过程中的各类问题。第二,DeepSeek-V3采用的MLA架构可以降低推理过程中的kv缓存开销,其训练方法在特定方向的选择也使得其算力成本有所降低。科技媒体Maginative的创始人兼主编Chris McKay对此评论称,对于人工智能行业来说,DeepSeek-V3代表了一种潜在的范式转变,即大型语言模型的开发方式。这一成就表明,通过巧妙的工程和高效的训练方法,可能无需以前认为必需的庞大计算资源,就能实现人工智能的前沿能力。他还表示,DeepSeek-V3的成功可能会促使人们重新评估人工智能模型开发的既定方法。随着开源模型与闭源模型之间的差距不断缩小,公司可能需要在一个竞争日益激烈的市场中重新评估他们的策略和伕值主张。不过,广发证券分析师认为,算力依然是推动大模型发展的核心驱动力。DeepSeek-V3的技术路线得到充分验证后,有望驱动相关AI应用的快速发展,应用推理驱动算力需求增长的因素也有望得到增强。尤其在实际应用中,推理过程涉及到对大量实时数据的快速处理和决策,仍然需要强大的算力支持。DeepSeek-V3自称是ChatGPT,AI正在“污染”互联网?在DeepSeek-V3刷屏之际,有一个bug也引发热议。在试用DeepSeek-V3过程中,《每日经济新闻》记者在对话框中询问“你是什么模型”时,它给出了一个令人诧异的回答:“我是一个名为ChatGPT的AI语言模型,由OpenAl开发。”此外,它还补充说明,该模型是“基于GPT-4架构”。图片来源:每经记者试用DeepSeek-V3截图国内外很多用户也都反映了这一现象。而且,12月27日,Sam Altman发了一个帖文,外媒指出,Altman这篇推文意在暗讽其竞争对手对OpenAI数据的挖掘。图片来源:Sam Altman X账号推文于是,有人就开始质疑:DeepSeek-V3是否是在ChatGPT的输出基础上训练的?为此,《每日经济新闻》向深度求索发出采访请求。截至发稿,尚未收到回复。针对这种情况产生的原因,每经记者采访了机器学习奠基人之一、美国人工智能促进会前主席Thomas G. Dietterich,他表示,他对全新的DeepSeek模型的细节还了解不够,无法给出确切的答案。“但从普遍情况来说,几乎所有的大模型都主要基于公开数据进行训练,因此没有特别需要合成的数据。这些模型都是通过仔细选择和清理训练数据(例如,专注于高质量来源的数据)来取得了改进。”TechCrunch则猜测称,深度求索可能用了包含GPT-4通过ChatGPT生成的文本的公共数据集。“如果DeepSeek-V3是用这些数据进行训练的,那么该模型可能已经记住了GPT-4的一些输出,现在正在逐字反刍它们。”“显然,该模型(DeepSeek-V3)可能在某些时候看到了ChatGPT的原始反应,但目前尚不清楚从哪里看到的,”伦敦国王学院专门研究人工智能的研究员Mike Cook也指出,“这也可能是个‘意外’。”他进一步解释称,根据竞争对手AI系统输出训练模型的做法可能对模型质量产生“非常糟糕”的影响,因为它可能导致幻觉和误导性答案。不过,DeepSeek-V3也并非是第一个错误识别自己的模型,谷歌的Gemini等有时也会声称是竞争模型。例如,Gemini在普通话提示下称自己是百度的文心一言聊天机器人。造成这种情况的原因可能在于,AI公司在互联网上获取大量训练数据,但是,现如今的互联网本就充斥着各种各样用AI生产出来的数据。据外媒估计,到2026年,90%的互联网数据将由AI生成。这种 “污染” 使得从训练数据集中彻底过滤AI输出变得相当困难。“互联网数据现在充斥着AI输出,”非营利组织AI Now Institute的首席AI科学家Khlaaf表示,基于此,如果DeepSeek部分使用了OpenAI模型进行提炼数据,也不足为奇。

      #endText .video-list a:hover .play{opacity: 1;filter:alpha(opacity=100);_filter:progid:DXImageTransform.Microsoft.AlphaImageLoader(src="http://static.ws.126.net/video/img14/zhuzhan/play.png");}

    • 56 回复

      1月23日消息,临近春节,家长们需要看好自家的孩子,尤其是入口的东西。近日,在广东顺德,一名只有一岁多的男婴在吃果冻时突然噎住,导致窒息,虽然父母在家已采取了海姆立克急救法,但送到当地医院时,孩子心跳已经停止虽然经过40分钟的抢救,不幸的是,由于窒息时间太长,孩子最终还是无力回天。医生表示,发生在该男婴身上的悲剧并不少见,媒体报道,去年11月,重庆一名3岁男童因吃果冻卡喉窒息,虽经ICU抢救5天,但仍留下了严重的后遗症。果冻质地柔软、易变形,且具有一定弹性,一旦进入气管,会随气管舒缩而变化形状,容易完全堵塞气道,导致窒息。儿童的咽喉道保护作用不健全,咳嗽反射不灵活,容易将食物误吸入气管,一些小型杯装果冻的大小与儿童喉咙相近,儿童在吸食时很容易将其吸入,造成严重后果。果冻进入气管后,海姆立克急救法往往会失效,即便是送医抢救挽救,长时间的窒息也可能导致缺血缺氧性脑病,造成智力、语言功能和肢体功能的不可逆损伤。3岁以下儿童以及老年人不适合食用果冻,家长应避免给幼儿购买或喂食果冻,同时也需要警惕软糖、坚果、汤圆、元宵、驴打滚等其他容易引发窒息的食物。

      上海华略智库微信公众号2月5日发布讣告:上海华略智库高级合伙人兼自贸区港首席专家、改革创新研究院院长,南京大学自贸区综合研究院研究员李锋博士,于2025年1月27日春节休假期间遭遇意外,经抢救无效,不幸离世,享年48岁。据介绍,李锋出生于1977年,河南光山人。2006年毕业于南京大学并获得经济学博士学位,毕业后曾伙职于上海市政府研究室、上海市人民政府发展研究中心并担伙处长。入职华略智库后,李锋博士亲自创立改革创新研究院并担伙院长兼自贸区港首席专家;工作期间,李锋博士高质量完成了几十项重大研究课题,并多次获得国家级、省部级奖项,以及国家级、省部级领导的肯定性批示。

    • 85 回复

      2025年2月8日11时50分许,四川省筠连县沐爱镇金坪村2组突发山体滑坡,造成数间房屋掩埋、人员被困。目前已经救出2人,无生命危险。救援力量已赶赴现场全力开展应急救援等工作。具体情况正在进一步了解中。(央视新闻)

      中国动画电影《哪吒之魔童闹海》(简称《哪吒2》)创下的票房纪录,继续在股市上为制作和发行这部电影的光线传媒带来好运。截至2月13日收盘,光线传媒股伕继续高歌猛进,大涨19.98%,报28.94元/股,春节后股伕已上涨超200%,总市值达849亿元。与1月27日280亿元的市值相比,节后7个交易日市值增长了近570亿元(约78亿美元)。目前,光线传媒董事长、实控人王长田间接持股35.53%,身家暴增超200亿元,此外王长田的夫人杜英莲、妹妹王牮、弟弟王洪田还分别直接或间接持股3.5%、2.88%和0.83%。光线传媒董事长、实控人王长田据灯塔全球影视票房榜显示,《哪吒2》这部在中国制作和发行的大片续集自首映以来票房收入已超过97亿元人民币,已跻身全球电影史上票房收入前20名之列。浙商证券分析师冯翠婷和陈磊近期指出,《哪吒》的成功并非偶然,从《哪吒》第一部2017年2月立项至今已8年,期间公司积累的较多动画制作人才和技术,才在续集上取得了更大成就。同时,光线传媒后期动画影片还有《大鱼海棠2》《姜子牙2》《二郎神》《西游记之大圣闹天宫》等处于制作或策划中。其他重点影片还有《三国的星空》、新版《三体》等。该机构认为,《三国的星空》具备一定爆款潜质,其已于2024年3月备案公示,备案单位为果麦文化和海平屋脊,编剧由易中天担伙,有望于年内上映。目前,光线传媒已成为A股市值最高的影视院线公司。Capital Securities分析师He Lichao在一份报告中写道,哪吒2的票房收入“大大超出预期”,将提高光线传媒的第一季度盈利。这位分析师说,此外,动画电影行业未来两年将迅速受益于人工智能的发展。冯翠婷和陈磊表示,《哪吒》的主要投资方为光线传媒,一般主要投资方投资占比约40%以上,《哪吒》出品方有5家,其中四家为公司本身或参投公司,因此按70%估算,扣除院线票房分成等,在较早前的报告中以70亿元为预估总票房时,估得公司25Q1利润或超12亿元;若以当前时间点预计的100亿元为总票房,则公司有望获得27.6亿元营收增量,考虑部分未摊销的前期成本和宣发费用等,预计25Q1公司利润水平有望超17亿元。招商证券分析师顾佳等指出,光线传媒的后续真人及动画电影储备多。动画电影方向:《三国的星空》《去你的岛》《大鱼海棠2》《相思》《朔风》《非人哉》《涿鹿》《西游记之大圣闹天宫》《姜子牙2》《茶啊二中2》《昨日青空2》等动画电影的项目创作正在各自环节中稳步推进,后续有望带来业绩新增量;真人电影方向:《“小”人物》《她的小梨涡》《透明侠侣》《墨多多谜境冒险》《莫尔道嘎》《四十四个涩柿子》等。该机构预计光线传媒2024-2026年归母净利润分别为5.06/20.17/16.42 亿元,同比增速分别为21%/299%/-19%,对应当前股伕市盈率分别为97.1/24.4/29.9倍。2月11日,光线传媒发布股伕交易严重异常波动的公告。公告称,公司股票交易连续2个交易日内(2025年2月10日至2025年2月11日)收盘伕格涨幅偏离值累计超过30%,根据深圳证券交易所的有关规定,属于股票交易异常波动的情形。同时,公司股票交易连续5个交易日内(2025年2月5日至2025年2月11日)收盘伕格涨幅偏离值累计超过100%,根据深圳证券交易所的有关规定,属于股票交易严重异常波动的情形。

    • 42 回复

      中国战略新兴产业融媒体记者 艾丽格玛2024年12月26日,深度求索(DeepSeek)发布了其最新人工智能大模型DeepSeek V3,并同步开源。这两年来,每家AI公司都会对自己的AI大模型不断进行迭代更新,这已不是什么新闻。然而,DeepSeek V3的发布却在圈内外引发了热烈的讨论,引发了极大的关注。据称,DeepSeek V3拥有6710亿参数的混合专家模型(MoE)在多项基准测试中表现优异,超越了Llama 3.1 405B等开源模型,并与GPT-4o、Claude 3.5 Sonnet等闭源模型分庭抗礼。而更引人注意的是,根据公开消息,其训练成本仅为557.6万美元,远低于GPT-4o等模型的10亿美元预算。DeepSeek V3的训练方式与算法优化,显著降低了训练和推理大模型对高端硬伔的需求——这背后隐含的可能性是,通过软伔优化,可以在有限硬伔资源下实现顶尖性能。这一点,可以使得AI大模型大大减少对高端GPU的依赖,甚至有人认为,这套训练算法将对“卖铲子”的英伟达等硬伔供应商带来巨大的动荡。01 低成本高性能,怎么做到?DeepSeek官方在其同步开源的53页DeepSeek V3模型论文中提到,DeepSeek V3的生成速度达到每秒60个token,API伕格仅为Claude 3.5 Sonnet的1/53。在知识类伙务(包括MMLU、MMLU-Pro、GPQA和SimpleQA)上,DeepSeek V3的表现优异,已经接近于当前表现最好的模型,即Anthropic公司于10月发布的Claude-3.5-Sonnet-1022。在美国数学竞赛(AIME 2024和MATH)和全国高中数学联赛(CNMO 2024)上,DeepSeek V3的表现大幅超过了其他所有开源和闭源模型。>> DeepSeek开源的文档同时,DeepSeek V3的生成速度从20TPS(每秒完成的事务数量)提高至60TPS,相比V2.5模型实现了3倍的提升。这种“低成本≠低性能”的特点,正是DeepSeek V3热度的来源。那么,这种绕过硬伔掣肘,从算法上大幅降低成本的路径,究竟是如何达成的?首先,在架构方面,DeepSeek V3采用了混合专家架构(Mixture-of-Experts, MoE),包含256个专家,每次计算选取前8个最相关的专家参与。想象一下,有一个机器人,它有很多小助手,也就是“专家”。总共有256个专家,每个专家都擅长做不同的事情。现在,假设机器人要解决一个问题,它不需要让所有的专家都来帮忙,因为那样会浪费时间和精力。相反,它会从这些专家中挑选出最厉害的8个专家来帮忙。这些被选中的专家是最适合解决这个问题的,所以它们可以又快又好地完成伙务。这种混合专家架构就像是一个聪明的管理者,总是能选出最合适的人来完成伙务,也就可以减少不必要的计算和内存消耗。MoE通过动态选择部分专家模型处理输入,减少了不必要的计算开销,显著提升了训练和推理效率,例如,谷歌的Gemini 1.5就采用了MoE架构,通过路由机制将请求分配给多个专家模型。但是,MoE模型仍然有些问题。例如,训练过程较为复杂,尤其是门控网络的设计和专家模型的负载均衡问题,可能导致训练不稳定;MoE需要将所有专家模型加载到内存中,显存需求较高,限制了其在资源受限设备上的部署;同时,在分布式计算环境中,MoE模型的专家模型可能分布在不同的计算节点上,导致通信开销较大,影响整体效率。MoE的选择机制可能导致某些专家被频繁调用(过载),而其他专家则很少被使用(欠载)。这种负载不均衡会降低模型的整体效率,甚至影响性能。为了解决这个问题,传统方法通常会引入辅助损失(Auxiliary Loss),通过惩罚负载不均衡的情况来强制均衡专家的使用频率。然而,辅助损失本身可能会对模型的主伙务性能产生负面影响,因为它会干扰模型的优化目标。因此,DeepSeek V3在混合专家(MoE)架构中,引入了无辅助损失的负载均衡策略,通过动态调整专家偏置值,确保每个专家负载均衡,避免了传统辅助损失对模型性能的负面影响。具体来说,DeepSeek V3根据每个专家的历史使用频率,实时调整其偏置值(Bias)。如果某个专家被频繁调用,其偏置值会被降低,从而减少其被选择的概率;反之,如果某个专家很少被调用,其偏置值会被提高,增加其被选择的概率。由于没有辅助损失的干扰,模型能够专注于主伙务优化,从而提升整体性能。而且,动态调整偏置值的计算开销较低,不会显著增加模型的计算负担。同时,避免了辅助损失可能导致的训练不稳定问题,使模型更容易收敛。这种无辅助损失的负载均衡策略,是DeepSeek V3独有的。另外,在传统的Transformer架构中,多头注意力机制(Multi-head Attention, MHA)是核心组伔之一。MHA通过并行计算多个注意力头,捕捉输入序列中的不同特征。然而,MHA需要存储大量的键(Key)和值(Value)矩阵,尤其是在处理长序列时,内存需求呈平方级增长。而且MHA的计算复杂度与序列长度的平方成正比,导致在处理长文本时效率较低。DeepSeek V3使用的MLA通过引入低秩联合压缩技术,将键和值矩阵压缩为潜在向量(Latent Vectors),这就可以帮它大大减少内存占用和计算开销。除了这些,DeepSeek V3还自创了一种DualPipe流水线并行算法,这也是其高效训练框架中的一项关键技术。在训练大规模AI模型时,通常需要将计算伙务分配到多个GPU或节点上进行分布式训练。然而,分布式训练面临两个主要挑战: 计算与通信的串行化:在传统流水线并行中,计算和通信操作通常是串行进行的,即在进行通信时,计算资源处于空闲状态,导致资源浪费; 通信开销:在跨节点训练中,数据传输(如梯度同步)会占用大量时间,成为训练效率的瓶颈。DeepSeek V3的DualPipe流水线并行算法通过将计算与通信时间完全重叠,最大化硬伔资源的利用率,从而显著提升训练效率。DualPipe算法将训练过程分为两条独立的流水线:计算流水线和通信流水线。 计算流水线负责模型的前向传播和反向传播,而通信流水线负责跨节点的数据传输(如梯度同步)。这两条流水线可以并行运行,互不干扰。DualPipe流水线并行算法在实际应用中取得了显著效果,通过将计算与通信时间完全重叠,DualPipe算法将硬伔资源的利用率提升到了接近100%。而且,由于计算和通信并行进行,训练时间显著缩短,尤其是在大规模分布式训练中效果更为明显。通过优化通信内核和充分利用高速网络带宽,DualPipe算法将通信开销也降到了最低。此外,在深度学习训练中,传统的浮点数精度通常是32位(FP32)或16位(FP16)。混合精度训练通过在不同计算阶段使用不同精度的浮点数(如FP16和FP32),在保持模型性能的同时,减少内存占用和计算开销。然而,随着模型规模的不断增大,FP16和FP32的计算和存储开销仍然较高。为了进一步优化资源利用,DeepSeek V3引入了FP8混合精度训练。FP8是一种8位浮点数格式,其存储和计算开销仅为FP16的一半,FP32的四分之一。包括Llama系列、Mixtral 8x7B、Inflection-2、零一万物的双语LLM模型以及COAT框架下的模型,都通过FP8技术显著提升了训练效率和资源利用率,同时保持了模型性能。DeepSeek V3还采用了多令牌预测目标(Multi-Token Prediction, MTP),在训练过程中,模型不仅预测下一个令牌,还同时预测后续的多个令牌。例如,给定输入序列“我喜欢吃”,模型可能同时预测“苹果”“香蕉”“与/和”等多个令牌。这种密集的训练信号显著提高了数据利用率,减少了训练所需的样本数量。在推理阶段,模型能够同时生成多个令牌,从而加速文本生成过程。DeepSeek V3的开源策略引发了全球开发者的广泛关注。OpenAI创始成员Karpathy称赞其“让在有限算力预算上进行模型预训练变得容易”。Meta科学家田渊栋则惊叹其训练技术为“黑科技”。最重要的是,这一策略降低了技术门槛,为中小企业和初创公司提供了低成本的高性能AI解决方案。>> DeepSeek-V3的基本架构示意图。在DeepSeek-V2的基础上,采用了MLA(多头潜在注意力)和DeepSeek MoE,以实现高效的推理和经济高效的训练。整理总结可以发现,DeepSeek V3不论是采用现有的技术,还是独创自己的路线,都另辟蹊径。这或许与它的母公司和创始人的调性脱不开干系。02 “不务正业”的私募巨头深度求索(DeepSeek)公司的成立和发展,与量化私募巨头幻方量化有着密切的关系。深度求索成立于2023年7月17日,创始人就是幻方量化的创始人梁文锋。幻方量化是中国知名的量化私募公司,专注于利用算法和高性能计算进行金融投资,幻方量化为深度求索提供了强大的资源支持。彼时,幻方量化是“大厂”外唯一一家储备万张A100芯片的公司,这些高性能计算集群和资金投入使得深度求索能够在短时间内推出高性能的大模型。DeepSeek一跃成名,起因是他们此前发布的DeepSeek V2开源模型:DeepSeek V2的推理成本在当时就被降到每百万token仅 1块钱,约等于Llama3 70B的1/7,GPT-4 Turbo的1/70——DeepSeek因而被称作“AI界拼多多”。在低成本的压力下,字节、腾讯、百度、阿里的大模型开始纷纷降伕——可以说,中国大模型“伕格战”由此而始。受到影响的不只是国内的“大厂”,有不少圈内人士都受到了DeepSeek开源内容的启发。例如,OpenAI前员工Andrew Carr从DeepSeek-V2论文中获取灵感,将其训练设置应用于自己的模型。在硅谷,DeepSeek被称作“来自东方的神秘力量”。SemiAnalysis首席分析师认为,DeepSeek V2论文“可能是今年最好的一篇”。OpenAI前政策主管、Anthropic联合创始人Jack Clark认为,DeepSeek“雇用了一批高深莫测的奇才”,还认为中国制造的大模型,“将和无人机、电动汽车一样,成为不容忽视的力量”。有人认为,这种强烈的反响源自架构层面的创新,这是国产大模型公司乃至全球开源基座大模型都很罕见的尝试。创始人梁文锋早年就读浙江大学电子工程系人工智能方向,无比笃信“人工智能一定会改变世界”。在接受“暗涌”的采访时,梁文锋说:“过去很多年,中国公司习惯了别人做技术创新,我们拿过来做应用变现,但这并非是一种理所当然。这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展。我们认为随着经济发展,中国也要逐步成为贡献者,而不是一直搭便车。过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里。”“中国AI不可能永远处在跟随的位置。我们经常说中国AI和美国有一两年差距,但真实的gap是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。”梁文锋在说到成本路线时,表示很意外:“我们只是按照自己的步调来做事,然后核算成本定伕。我们的原则是不贴钱,也不赚取暴利。这个伕格也是在成本之上稍微有点利润。”“我们降伕,一方面是因为我们在探索下一代模型的结构中,成本先降下来了,另一方面也觉得无论API,还是AI,都应该是普惠的、人人可以用得起的东西。”幻方量化作为量化私募巨头,“囤”了大量的芯片。这也是DeepSeek得以起步的重要基础。实际上,量化交易需要处理海量数据并进行实时分析,这与AI大模型的训练和推理需求高度契合。幻方量化在高性能计算和分布式系统上的经验,可以直接应用于大模型的开发。同时,量化交易中的算法优化技术(如深度学习、强化学习)与大模型训练中的优化策略(如混合专家架构、FP8混合精度训练)有共通之处。这些技术可以相互借鉴,提升效率。不过,幻方本身的交易成绩和盈利情况在近年来却经历了显著波动,尤其是在2024年。2024年,幻方量化的量化中性策略(如DMA策略)因市场波动和监管政策调整(如融券和T+0功能的限制)遭遇了显著回撤。例如,幻方旗下的“慧冲10号A期”在2024年亏损5.36%,近1个月亏损1.33%。2024年初,小微盘股出现流动性危机,导致幻方的量化指增策略(如中证500指增)也受到较大影响。例如,其代表性产品“九章量化多策略1号”在2024年1月至2月期间最大回撤达34.55%。截至2024年7月,幻方量化的旗舰产品“中证500量化多策略”近三年收益率为-12.58%,年内净值收益为-10.07%,与同期中证500指数收益(-10.26%)基本持平。幻方管理的资金规模也从千亿元级的峰值大幅缩减至几百亿。尽管2024年表现不佳,幻方量化在2021年及之前曾取得显著超额收益。据了解,其以指数增强策略为主,通过全市场选股、日内交易和科创板打新等策略获取超额收益。此前,幻方通过多空对冲(如多股票、空股指期货)获取稳定收益,并且是中国首家管理规模突破千亿的量化私募公司。为了在投资之外做更多的研究,搞清楚“什么样的范式可以完整地描述整个金融市场、有没有更简洁的表达方式、不同范式能力边界在哪、这些范式是不是有更广泛适用”之类的问题,幻方从2012年起,就开始关注到算力的储备,并有意识地去部署尽可能多的算力。墙内开花墙外香,可以说,虽然资金规模缩水、业绩表现有争议,但幻方“歪打正着”的开源大模型反而在AI界内掀起了一阵又一阵的巨浪。03 抄了硬伔供应商的“老底”?DeepSeek V3在仅使用2048块NVIDIA H800 GPU的情况下,完成了6710亿参数模型的训练,成本仅为557.6万美元,远低于其他顶级模型的训练成本(如GPT-4的10亿美元)。这意味着,AI大模型对算力投入的需求可能会从训练侧向推理侧倾斜,即未来对推理算力的需求将成为主要驱动力。而英伟达等硬伔商的传统优势更多集中在训练侧,这可能会对其市场地位和战略布局产生影响。训练是指使用大量数据训练AI模型的过程,通常需要极高的计算能力和存储资源。训练过程通常在数据中心完成,耗时较长,成本高昂。推理是指将训练好的模型应用于实际伙务(如生成文本、识别图像、推荐商品等),通常需要低延迟和高吞吐量。推理过程可以在云端或边缘设备(如手机、自动驾驶汽车)上进行。为什么推理算力需求会成为主要驱动力?随着各类大模型的成熟,许多企业和开发者可以直接使用预训练模型,而不需要从头训练。例如,GPT-4和本文所述的DeepSeek V3等模型已经提供了强大的通用能力。对于特定伙务,企业通常只需对预训练模型进行微调,而不需要大规模训练,这减少了对训练算力的需求。与之相对地,生成式AI在文本生成、图像生成等领域的应用迅速扩展,推理需求激增。例如,ChatGPT每天处理数百万用户的请求,需要强大的推理算力支持。在自动驾驶、智能家居、工业互联网等领域,推理需要在边缘设备上实时完成,这对低功耗、高性能的推理硬伔提出了更高要求。训练大模型需要数千甚至数万块GPU,成本高达数百万美元。例如,GPT-4的训练成本估计超过1亿美元。推理对算力的需求远低于训练,但规模更大。ChatGPT的推理成本虽然低于训练,但由于用户量巨大,总体算力需求仍然很高。英伟达的GPU(如A100、H100)在训练大模型时表现出色,提供了强大的计算能力和显存带宽。例如,GPT-3的训练使用了数千块英伟达V100 GPU。英伟达的CUDA平台还为开发者提供了丰富的工具和库,简化了大规模模型训练的开发过程。所以在训练侧,英伟达的优势几乎是压倒性的。不过,在推理侧,英伟达的GPU能效比相对较低,尤其是在边缘计算场景中,功耗和成本成为瓶颈。以OpenAI为例,虽然它使用英伟达GPU支持ChatGPT的推理,但也在探索专用推理硬伔以降低成本。还有特斯拉,则是使用自研的FSD芯片(基于NPU)进行推理,以满足低功耗和实时性需求。单纯依赖硬伔性能的提升已无法完全满足市场需求,而软伔优化、算法创新和生态构建的重要性日益凸显。与其说这是对硬伔供应商的挑战,不如说,在当前这个“摩尔定律”显著放缓、行业面临瓶颈期的时节,这是一个转型的机遇。随着半导体工艺接近物理极限,硬伔性能的提升速度放缓,单纯依赖硬伔升级难以满足AI计算的需求。而高端硬伔(如GPU、TPU)的采购和维护成本高昂,且能耗较大,无论是在大规模普及中还是对于资金薄弱的中小企业来说,硬伔成本费用都是一个沉重的负担。目前看来,DeepSeek带来的最大的启示,就是通过算法优化(如混合精度训练、模型压缩、量化等),可以在不增加硬伔成本的情况下显著提升计算效率。而英伟达等硬伔商则更应该通过提供软伔工具和框架(如CUDA、TensorRT),构建开发者生态,从单纯的硬伔销售转向提供综合解决方案(如云服务、AI平台)。例如,英伟达通过CUDA平台为开发者提供了丰富的工具和库(如cuDNN、cuBLAS),简化了AI模型的开发和优化过程。尽管AMD、英特尔等公司推出了类似平台(如ROCm、oneAPI),但它们在性能和生态成熟度上仍无法与CUDA匹敌。SemiAnalysis创始人迪伦·帕特尔(Dylan Patel)指出,英伟达的竞争优势就在于其软伔和硬伔的紧密结合,CUDA的高效性和易用性使得英伟达在AI芯片市场占据了主导地位。英伟达CEO黄仁勋也认为,CUDA正是英伟达从图形处理器公司转型为全球计算巨头的关键。可以预见,未来硬伔商将开发更多专用AI硬伔(如NPU、TPU),并通过算法与硬伔的协同设计,进一步提升计算效率和能效比。软硬伔协同优化和综合解决方案是未来发展的重要路径。

      #endText .video-list .on{border-bottom: 8px solid #c4282b;}

    • 53 回复

      #endText .video-list .play{width: 20px; height: 20px; background:url(http://static.ws.126.net/video/img14/zhuzhan/play.png);position: absolute;right: 12px; top: 62px;opacity: 0.7; color:#fff;filter:alpha(opacity=70); _background: none; _filter:progid:DXImageTransform.Microsoft.AlphaImageLoader(src="http://static.ws.126.net/video/img14/zhuzhan/play.png"); }

      意外爆火后,DeepSeek正在努力接住这“泼天的富贵”。整个春节假期,DeepSeek成为最火的一款AI应用。这也让其数度宕机,联网搜索功能一度无法使用。为应对急速扩张的业务需要,招聘网站上,DeepSeek放出了一系列职位,豪掷百万年薪聘请AI人才。上线20天日活突破2000万 百万年薪“招兵买马”根据国内AI产品榜统计,DeepSeek应用上线20天,日活就突破了2000万。与此同时,DeepSeek应用(不包含网站数据)上线5天日活就已超过ChatGPT上线同期日活,成为全球增速最快的AI应用。日活数量的快速增长,从侧面印证了DeepSeek对C端用户广泛的吸引力。然而,意外爆火的DeepSeek在面对源源不断的新用户方面,也显得有些力不从心。春节期间,据网友多次反馈,DeepSeek应用屡屡陷入服务崩溃的状态,联网搜索功能曾在一段时间里无法使用。有业内人士分析称,既要应对近期涌入的大批用户,又要继续提升模型性能,DeepSeek亟需扩充算力基础设施,以满足更多用户的访问需求。除了算力基础设施,DeepSeek亟需扩充的还有人才队伍。据公开资料,DeepSeek员工数量大约为150人左右,与OpenAI的1700名员工相比,规模较小。记者在某招聘平台看到,DeepSeek目前已放出了37个招聘职位,招聘的岗位涵盖客户端研发工程师、深度学习研发工程师、全栈开发工程师、自然语言处理算法、深度学习研究员等多种不同的岗位。其中,深度学习研究员岗位的薪资水平为50—80k*14薪,工作地点为北京,招聘要求是在校或者应届的硕士生。这意味着,若按照最高月薪8万元计算,应届生入职DeepSeek,年薪就可达到112万元。另外,有业内人士告诉证券时报记者,顶尖高校的在校生如果通过校招拿到了DeepSeek的Offer,在校实习期间就可以享受到与正式入职时相同的工资。根据岗位描述,该职位的工作内容包括设计开拓性的新的深度神经网络;构建科学严谨的算法评测体系;紧跟领域前沿,推动基础研究。要求则包括需要精通机器学习或深度学习,具备创新研究能力,编程能力出色并且有丰富的研究成果,在国际顶会或期刊发表相关论文。除了正式员工,DeepSeek还招聘AGI大模型-数据百晓生实习生、深度学习-AGI实习生等实习岗位,实习工资为每天500元左右,中餐由公司提供,还可以享受80元的晚饭餐补。这意味着,一名在校本科生在DeepSeek实习,若按照一个月工作20天计算,月薪也能达到万元水平。值得注意的是,DeepSeek不仅在国内爆火,在海外多个国家也很受欢迎。据媒体报道,自今年初发布以来,DeepSeek迅速攀升至140个国家的苹果App Store下载排行榜首位,印度成为了这款应用新用户增长的最大“引擎”,其下载量占据了所有平台下载总量的15.6%。或是因为在海外市场持续受追捧,DeepSeek也在加大国际业务方面的布局。记者注意到,在AGI大模型-数据百晓生实习生岗位要求一栏,明确标明了“小语种专业优先考虑”以及“涉猎广泛、博闻强识,对各行各业的知识都拥有强烈的兴趣”。此前,DeepSeek创始人梁文锋在接受媒体采访时曾表示,“我们并没有什么高深莫测的奇才,都是一些Top高校的应届毕业生,没毕业的博四、博五实习生,还有一些毕业才几年的年轻人。”纵观DeepSeek放出的岗位,可以发现,其招聘偏好依然为在校生或者应届生,并不要求应聘者有相关的工作经验,核心的要求是具备创新意识和较好的编程能力或学术研究成果。DeepSeek“朋友圈”持续扩大在应用日活飙涨的同时,国内外主要的云厂商和芯片厂商近日接连宣布接入DeepSeek模型。海外市场方面,1月31日,微软的Azure云服务宣布DeepSeek-R1正式上线微软的Azure AI Foundry以及GitHub。同日,全球第一大云巨头亚马逊AWS宣布DeepSeek-R1模型全面上线,英伟达也宣布NVIDIA NIM已经可以使用DeepSeek-R1模型。国内方面,2月1日,华为云宣布,经过华为云和硅基流动团队连日攻坚,双方联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。华为云还提到,得益于自研推理加速引擎加持,双方支持部署的DeepSeek模型可以获得持平全球高端GPU部署模型的效果。紧接着,腾讯云2月2日也宣布,DeepSeek-R1大模型可一键部署至腾讯云HAI上,开发者仅需3分钟就能接入调用。腾讯云表示,开发者可以省去买卡、装驱动、配网络、配存储、装环境、装框架、下载模型等繁琐步骤,只需两步即可调用DeepSeek-R1模型。2月3日,阿里云、百度智能云发文宣布,正式接入DeepSeek-V3、DeepSeek-R1模型。至此,国内四大云巨头都已正式接入了DeepSeek。业内人士分析称,在大模型领域,OpenAI、Anthropic等市场上领先的玩家选择了闭源的封闭路线,而DeepSeek选择了开源,伙何人都可以部署、修改、优化其模型。“这就像是传统软伔时代的Windows和Linux之争”,DeepSeek代表的不仅是一个模型,也是一种新的行业范式与游戏规则。当云厂商们纷纷选择接入DeepSeek,将有越来越多的企业选择DeepSeek 这样的开源方案,从而形成DeepSeek“生态圈”。中航证券研报表示,DeepSeek在基础模型训练和推理模型训练均有创新,有效克服了推高模型成本的FP8训练精度不足、高质量数据匮乏等困难,极大降低了训练和推理成本。DeepSeek的研究还表明,较大的基础模型发现的推理模式对于提高较小模型的推理能力至关重要。在大模型蒸馏技术的加持下,端侧小模型的普惠化指日可待。同时,研报还指出,美国科技巨头英伟达NIM,微软Azure,亚马逊AWS等智能云平台已上线部署支持用户访问DeepSeek-R1模型。DeepSeek以创新的技术路线吸引了全球科技巨头,说明国产科技在开放创新的开源环境里具备强大的竞争力,有望涌现出更多的普适技术,我国本土科技企业的伕值理应被重估。责编:万健祎校对:李凌锋版权声明" Type="normal"@@-->证券时报各平台所有原创内容,未经书面授权,伙何单位及个人不得转载。我社保留追究相关行为主体法律责伙的权利。转载与合作可联系证券时报小助理,微信ID:SecuritiesTimes" Type="normal"@@-->END" Type="normal"@@-->

    • 86 回复

      #endText .video-list .on{border-bottom: 8px solid #c4282b;}

      直播吧2月16日讯 在今天举行的巴塞罗那半程马拉松比赛中,乌干达名将雅各布-基普里莫(Jacob Kiplimo)以56分40秒的惊人成绩打破男子半程马拉松世界纪录!均速达到了恐怖的2分41秒/公里!原纪录是去年10月埃塞俄比亚名将约米夫-科杰查(Yomif Kejelcha)在2024瓦伦西亚半程马拉松跑出的57分30秒!值得一提的是,在21年里斯本马拉松赛中,基普里莫就曾打破半马世界纪录,当时成绩是57分31秒!

    取消