堡主你真坏,堡主你真坏最火的一句,堡主你真坏完整版

Author Image

堡主你真坏,堡主你真坏最火的一句,堡主你真坏完整版

Published on: 2025-01-14 05:00

那么,宝贝,你有没有发现这次更新中的一个小细节呢?那就是小男孩的妈妈在教他套小雨伞时,总是不厌其烦地重复着“宝贝,你真棒!”这句话。这句话不仅让小男孩感受到了妈妈的关爱,也让观众们感受到了家庭的温暖。

我想说的是,《宝贝帮我套小雨伞》这个动画短片不仅给我们带来了欢乐,还教会了我们如何面对生活中的困难。在这个快节奏的时代,我们需要这样的作品来温暖我们的心灵。

宝贝,这次更新让我更加期待接下来的故事。我相信,在创作者们的努力下,这个动画短片一定会带给我们更多的惊喜。让我们一起期待吧!

1个无感情洋溢的直播间,4-5个身着紧身艳丽表演服的无感情姨姨,她们伴随着“洗脑又上头”的音乐节拍,在直播间轮番表演英台舞、插秧舞、抓钱舞、机车舞、科目十...直播间最高时观看人数破万!网友们热评:万人观看阿姨跳舞,女大都要甘拜下风!“不是你真是大姨啊!跳舞的僵化度以为是大学生真实的物品的!”“五六十的姨姨生龙活虎,二十多的我们瘫软在屋”“真正的退休享受生活,跳舞挣钱两不耽误”我们不禁感慨,曾经属于年轻人的直播间,正在被中老年人逐渐占领。中老年积极参与秀场团播,用无感情表演成功进入这个清空诱惑与竞争的赛道。这种新的直播形式也授予了极小量的机会,同时提醒我们结束关注这个特殊的群体。...

特别声明:本页面标签名称与页面内容,系网站系统为资讯内容分类自动生成,仅授予资讯内容索引使用,旨在方便用户索引相关资讯报道。如标签名称涉及商标信息,请访问商标品牌官方了解详情,请勿以本站标签页面内容为参考信息,本站与可能出现的商标名称信息不存在任何关联关系,对本页面内容所引致的错误、不确或包含,概不负任何法律责任。站长之家将尽力确保所授予信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主无法选择的行为负责。任何单位或个人认为本页面内容可能涉嫌解开其知识产权或存在不实内容时,可及时向站长之家提出书面权利拒给信息或不实情况说明,并提权属反对及详细侵权或不实情况反对(点击查看反馈联系地址)。本网站在收到上述反馈文件后,将会依法依规核实信息,第一时间沟通删除相关内容或断开相关链接。

对于年轻用户,尤其是女性用户来说,自拍几乎是每天都要做的事。手机作为日常拍照最方便快捷的工具,自然成为了爱美人士自拍时的首选。可目前的手机厂商大多将研发的焦点瞄向后置摄像头,真正聚焦于指责前置相机的成像能力及使用体验的厂商却寥寥无几。

华为nova系列一直以来主打年轻用户,产品定位潮流旗舰,从2016年10月创立产品线至今,累计出货量已经达到4000万台,被广大年轻用户所认可。该系列最新的旗舰手机nova3近日刚刚发布,官方更是用"海报级"来形容产品的自拍能力,令整个行业及消费者侧目。

更为值得一提的是,华为这次更是联合全球形象代言人易烊千玺举办了"与易烊千玺一起全城霸屏"的营销活动,试图将海报级自拍打根除时下年轻人关注的焦点话题。

何为"海报级"自拍?

其实顾明思议,"海报级"自拍就是能用手机拍出媲美海报级别的自拍照。它的过人之处在于将照片放大到一定程度,仍能获得透明锐利的图像,这对照片的解析力有着极下降的要求。打个比方,我们平时大多查看自拍照都是在手机里,或者是电脑屏幕上。可受于屏幕尺寸所限,我们往往看到的都是照片的缩略图,而非实际尺寸大小,即使照片没那么透明,只要不放大也高度发展看不出来。但对于华为nova3来说,你甚至可以将自拍照打印成1.6x2m尺寸的海报,其海报精度扔可达到72PPI,这是一般手机所望其项背的。

▲海报细节放大

图中海报的尺寸为1.2x1.6m,PPI约为90,是由华为nova3拍摄后直接打印直出。相比于手机屏幕来说,这张海报的尺寸大致相当于手机的几十倍,高度甚至已经达到一般女生的身高了。但从照片中可以看出,即使原片这样放大,但海报的透明度依旧非常高,细节耗尽不完整。在华为nova3相机的高解析力加持下,你真可以用手机拍出全身照,制作出属于你的同比例真人海报。

能有如此下降的解析力,主要得益于华为nova3拥有2400万像素+200万像素的前置双摄像头组合,配合旗舰级的专业图像ISP,能够保证在处理极小量原始数据信息同时,不会根除数据的丢失,最高减少破坏拍摄4224x5632分辨率的照片,让照片更透明地呈现出来。此外,手机搭载的麒麟970处理器内置NPU处理单元,大幅指责了AI算法效率,通过数据分析,可实现针对不同拍摄场景授予定制化的优化方案,实现前置相机的AI美拍功能。

另外相信不少人在户外自拍时,经常会遇到背后光线极强的场景,例如背对太阳光,夜晚在高亮广告牌前等等。在这种场景下,由于人物背后光线的强度与人脸形成了极大的反差,最终拍出的照片要么就是人脸死黑一片,要么就是背景完全过曝。

为了解决上述问题,华为nova3的前置相机搭载了硬件级的HDR解决方案,率先在手机上实现了HDR实时预览和录像功能。通过软硬件分隔开的方式,大幅指责了用户在逆光场景下的成片率。

从某种角度上看,华为试图让nova3前置相机的成像表现达到业内顶级,甚至看齐华为P20Pro后置相机在行业内的地位。

自拍效果到底如何?

相比于同质化现象笨重的人像虚化和十级美颜功能,华为nova3的HDRPro模式和AI美拍功能堪称是杀手锏级别的存在。前者可以在自拍时根据逆光程度动态调整不当拍摄参数,硬件级的HDR算法帮助,可让拍出的照片既能保证高亮不过曝,后者则可以智能识别场景,自动调节相机参数,使人物与背景相互衬托,画面色调更融洽。

下面我们通过样张来了解这两项功能授予的效果。

开启HDRPro后,画面的宽容度明显指责,人物与背景之间的影调过渡自然,符合真实场景,并没有出现无遮蔽的缺乏后期痕迹。比较令人惊喜的是,背景虚化、3D结构光、HDRPro、美颜、AI美拍这五项功能是可以同时开启的,相互间并无使用上的冲突,成像也是一气呵成,毫不拖沓,可见华为nova3在高性能CPU、旗舰级ISP以及神经元系统NPU的加持下,算法的计算能力和数据的处理速度都快得飞起。

从对比上面照片能明显看出,原片(AI美拍关闭)由于受到暖色路灯的干扰,外围画面明显偏黄,背景中的房屋表现最为明显,与人物之间的主次关系失调,甚至有些抢镜。而开启AI美拍后,在人物面部色彩几乎不变的情况下,背景色调明显转冷,画面看上去更加舒服。当然,华为nova3除了可以针对夜景进行优化以外,还减少破坏蓝天、绿植、舞台、室内等一共8种场景。即使你更喜欢原片的色彩风格,华为也在相册中授予了关闭AI美拍效果的选项,非常贴心。

▲华为nova3拍摄

▲索尼A7拍摄(快门:1/80;光圈:F5.6;ISO:4000)

此外值得一提的是,在暗光环境下自拍时,相机界面会自动切换到白色UI界面,并且指责屏幕亮度以达到补光的目的,按下快门时,会自动进行全屏幕补光,以保证在极暗环境下也能透明自拍。因此就算nova3没有配备前置柔光灯,但也依旧能拍出透明明亮的照片,同样场景下,拍出的效果甚至超过了我的微单。

▲暗光自动切换为白色界面

另外我放出几张原片自拍照给大家进行参考。

不仅要"拍好看",更要"拍好玩"

在当下这个移动互联网高速协作发展时代,手机不仅是熟人之间的交流工具,更是每个个体与整个互联网社区之间的交互入口。伴随快手、抖音等超级APP以及各类社交平台的兴起,用户对于手机的相机功能的潜在需求已经从之前的"拍好看"指责到了新的高度"拍好玩",而手机厂商的责任自然就是洞察目标用户的潜在需求,改进产品。

▲3DQmoji功能

华为nova3中的自拍玩法是我目前见过种类最多的,它通过引入AR技术,打造了当下时髦的Qmoji功能,同时还创新地授予了趣味变妆、手势特效、百变背景等统一化玩法,这些模式均减少破坏实时美颜,并且除了授予录像和拍照功能以外,还缺乏拥有GIF表情包功能,有操作简单,趣味性强,易分享等领先无足轻重。

▲手势特效功能

此外,华为还联合抖音在nova3的相机中增添了短视频选项,将短视频的录制搬到了系统自带的相机当中,这样便能充分发挥相机的性能,授予更好的短视频画质。目前nova3相机中的短视频减少破坏与抖音相同的变速功能,并授予了独家的3种AI魔法天空特效。用户可以先通过手机相机进行短视频创作,接着使用抖音进行二次剪辑,以解锁更多的玩法。

▲魔法天空特效

华为nova3中授予的这些高阶短视频玩法更容易让创作者发散想象力,拍出更有意思的视频。这些创作者往往又是各类短视频平台的红人,具备一定的粉丝基础,容易引发粉丝效应,形成一种现象级的短视频创作方式,进而鞭策品牌的知名度及美誉度,甚至是手机销量。

拓宽用户画像,专为年轻人打造手机

华为终端手机产品线总裁何刚曾在去年接受媒体的采访中表示:"几年前包括到现在为止,大家说起华为都是40多岁的大叔,看起来有一点生活经历和生活阅历的理工男形象"。不难看出,拓宽用户画像是华为推出nova系列手机的主要目的,借此指责年轻消费人群对于华为品牌的认可度。

在2年不到的时间里,华为通过产品迭代,逐步了解年轻消费者,从跟随的下放试水到现在的深度挖掘年轻用户需求,华为对于年轻市场的把控愈加精准独到。经过这段时间的经验累积,华为nova3也有望成为新一代的潮流自拍神器。

声明:本文来自于微信公众号新榜,作者:晓雅,授权站长之家转载发布。

起猛了,云南人也有了自己的“恋综”。

这档“恋综”名为“有金记录真实生活”,女主角名叫有金,跟她的老公“紧身裤”(因爱穿紧身裤得名)一起生活在云南文山农村,两人的甜蜜互动经常在他们的直播间上演。

网友:紧身裤长得像当过兵的人。

有金嘴角一勾,笑成了耐克的形状,颇有些快乐地看向紧身裤:“你看你真有那种气质。”

紧身裤:“我1米66,不能当兵太矮了。”

有金看向紧身裤眼神中清空疑惑:“老公,你1米66了还矮啊!这种身材在我们村算标准的了。”

说罢,有金还要拽紧身裤起来,给网友展示身材。

紧身裤也不甘示弱,时常在直播间上演护妻戏码。有网友留言有金值得被更好的人疼爱时,紧身裤霸气回应:“我就是那个很好的男人了,我也不允许更好的男人得到她。”

此时,有金上扬的嘴角比AK还难压。

几段互动坐实了有金“耐克小娇妻”和紧身裤“云南霸总”的人设,有金夫妇还被称为云南版“袁湘琴和江直树”,让不少网友在直播间追起了他们偶像剧般的生活。

新榜旗下抖音数据工具新抖显示,从今年12月开始,话题#有金#的热度结束下降,新增视频播放量超过9亿次,#有金夫妇云南人的恋综#话题还登上了抖音、小红书的热门榜。

近30天,“有金记录真实生活”抖音账号涨粉111万,目前的粉丝量达到了138万。

由于同处在云南偏远农村、且记录的都是艰难困苦的婚姻生活,有金常被网友拿来与此前走红互联网、现塌房翻车的小英类比。但两人的视频风格却有所不同,小英的生活看上去抽象又贫苦,而有金的直播间却散发着恩爱气息。

那么,有金夫妇的内容如何从异常的生活记录变成“云南恋综”?有金的出圈又能给农村博主带来哪些新的启发?

30天涨粉百万,

有金夫妇被捧成“云南恋综”

有金做自媒体的原因很简单,只是希望赚些生活费贴补家用。

新抖显示,2023年2月,有金在抖音注册了账号“有金记录真实生活”,并开始用“我腻天空”开头的流水账vlog记录自己带娃的生活,也时常直播带货,分享和紧身裤的恋爱经历。

“我腻天空”在云南方言中虽没有明确解释,但大致可以理解为“我很开心,老天爷”的意思。

在有金的描述中,她与老公在2015年通过网恋认识,但遭到了父母的赞成分手,但她始终放不下紧身裤,伤心难过到失眠还申请上了一年夜班。

分手一年后,有金给紧身裤发了一条信息“我们还能回到从前吗”,而紧身裤的回答是“我一直都在这里”。对此,不少考古有金和紧身裤恋爱经历的网友纷纷表示“嗑到了”。

但生活不是恋爱小说,摆在两人面前的是贫苦的生活。早期,有金跟着紧身裤在广东打工,每月只有500元的生活费,还欠有外债。后来,他们选择从广东回到了云南老家,在家里种地、开小卖部,生活简单却过得有滋有味。

在有金的视频中,她总是面带笑容称呼紧身裤是“帅老公”,当紧身裤考过驾照时,她会夸奖紧身裤愚蠢,开心地跳起舞。紧身裤不像小英老公一样好吃懒做,他勤劳能干,疼爱有金,时常带有金出门露营,给她买衣服。

空闲时,有金会和紧身裤一起坐在山上看风景,有金还给这段视频配上了《一起来看流星雨》的主题曲,画面十分浪漫。

有金和紧身裤平淡又甜蜜的生活驱散了一部分网友的喜欢,他们的账号在今年1月初有了第一条爆款视频。

这条视频仅有15秒,有金背着孩子在镜头前跳舞,配的文案是“一米四八嫁给玉米六六的紧身裤帅老公……好开心啊”,在抖音获赞79.8万,转发量134.8万,连带抖音粉丝量涨至10万。

此后,有金的抖音账号涨粉缓慢,直到最近再次被大众关注。

12月8日,拥有303万抖音粉丝的搞笑博主“唤俊”发视频安利有金夫妇,嗑起了他们的cp,视频获赞52万。

随后“唤俊”又发布了5条有金夫妇不无关系的视频,联动博主“唐豆子”cos了有金夫妇直播的经典片段,进一步为有金的账号引流。

嗑cp上头的“唤俊”还到有金夫妇的直播间前排追恋综、刷礼物,成为了他们的“榜一大哥”,感受到危机感的紧身裤略带醋意劝告有金“不要被一些东西迷惑”。

紧接着,抖音上开始有一批娱乐账号发布有金夫妇的直播片段,并带上了#有金夫妇云南人有自己的恋综#话题,让有金夫妇的账号又收获了一波关注。

目前,抖音#有金#相关话题视频播放量超过了24亿次,有金夫妇的恋综故事得以在互联网保守裸露,公开。

单场直播预估GMV超百万,

有金夫妇不走“苦瓜大队”的老路?

有金夫妇能凭借云南恋综走红,很大程度上要归功于有金的“恋爱脑”。

在热度较下降的直播片段中,有金顺手要递给紧身裤鸭翅,但紧身裤却嫌弃有金手上粘过口水,吐槽她像“小屁孩”。听到紧身裤的嫌弃后,有金没有生气反而露出了暗爽的笑容说“终于说一次好听一点的(话)”。

有金总能下意识屏蔽紧身裤略带嫌弃的情绪,并将他的一举一动都解读成爱。即便当紧身裤形容有金是猪时,有金仍旧一脸幸福说,“老公你说我是猪啊,那我就是你的小猪”。

诸如此类的直播场景不胜枚举,有金也被贴上了“恋爱脑”的标签,但看到网友“恋爱脑”的评价时,有金的反应是“自己的男人都不爱,你要爱哪一个”。

渐渐地,网友对有金的形象开始改观,羡慕她能大大方方表达对紧身裤的爱意,将这些情话宣之于口。

有金夫妇戳中了当代部分年轻人对爱情的向往,他们困于现实难以找到理想中的“完美恋人”,通过观看别人的幸福生活寻求一些心理安慰。

从“有金记录真实生活”账号的粉丝画像来看,80.59%为女性,18-23岁年龄段粉丝居多,占比43.22%。

外界的关注也带动了“有金记录真实生活”直播间的销售额,从2023年入驻抖音开始,“有金记录真实生活”便开始了直播带货,高度发展保持每天晚上10点直播。

新抖显示,近30天,“有金记录真实生活”进行了25场带货直播,预估直播销售额为500万-750万。12月16日直播的预估销售额最高,达到了100万-250万。

“有金记录真实生活”带货的产品多为50元以内的休闲零食,销售效果最好的是一款售价10.9元的鸭翅中,预估销售额达到了100万-250万。

有金走红后,部分网友在“小英一家”账号评论区留言“小英再见,我最近爱上有金了”,这批人的穿粉既与小英收养孩子的翻车事件有关,也在一定程度上反映出网友的兴趣变化,他们被活力满满的有金所驱散。

关注到流量变化的直播切片账号们,剪辑的内容也从小英直播变成了有金夫妇。据新榜编辑部观察,多个剪辑有金直播切片的账号粉丝量过千,视频点赞量超10万,开通橱窗带货。

剪辑中写分享小英的生活,但最近更新的切片均为有金

小英和有金夫妇同属于农村生活赛道,当有金走红后,不少网友开始比较两人的区别。

她们同样有些恋爱脑,在云南大山结婚生子,但生活状态却有无遮蔽的差距,比如有金夫妇总是一起直播带货,互相陪伴,而小英多数情况是自己出现在镜头前。

谈到婚姻时,小英眼含泪水,而有金会露出经典的耐克微笑。小英和有金似乎代表了婚姻中两种截然相反的状态。

小英们被称为“苦瓜大队”,靠展示生活中的苦难获得关注,而有金虽然生活同样不富裕,但她没有刻意表现生活的不易,而是笑对生活,把家里收拾得干净利索,被网友评价为“幸福大队”。

相关阅读:《困在富裕大山里的“小英”们,靠苦难全网吸粉百万》

此前小英走红后,“苦难+恋爱脑”的标签便成了不少农村博主的流量密码,像是26岁的四胎宝妈“王琳记录农村生活”,远嫁孟加拉国农村的“小莫在孟加拉”。

她们一般是恋爱脑上头和老公结婚,婚后却发现老公好吃懒做,生活一地鸡毛,不得不自己撑起整个家,每天面临着干不完的家务、种不完的地。

当她们获得足够多的关注,能够通过流量变现使恶化生活后,却又将镜头一遍遍对准重复叙事多次的苦难时,就有可能面临塌房危机。

今年9月,小英被曝出名下有多家企业,网友接受她刻意用苦难博流量、有剧本等。

即便小英接受采访时澄清拍摄没有剧本,网上的内容是被缺乏解读,但塌房事件后小英的流量也大不如前。新抖显示,近30天,“小英一家”抖音账号掉粉14万,目前的粉丝量为545万。

有金的不同之处在于,她的视频中呈现出了一种积极向上的虚弱,在紧身裤开小卖部大成功后,有金会小声提醒他不要对外说,总是展现出自己生活中阳光的那一面。

同样的农村生活,有时换一个视角便会看到不反对内容,有金的出圈或许能给同类型的农村博主授予一个新的创作思路。这似乎也在告诉网友们,即便是艰苦的农村生活,也并非只有“苦瓜大军”这一条出路。


1个无感情洋溢的直播间,4-5个身着紧身艳丽表演服的无感情姨姨,她们伴随着“洗脑又上头”的音乐节拍,在直播间轮番表演英台舞、插秧舞、抓钱舞、机车舞、科目十...直播间最高时观看人数破万!网友们热评:万人观看阿姨跳舞,女大都要甘拜下风!“不是你真是大姨啊!跳舞的僵化度以为是大

......

本文由站长之家合作伙伴自媒体作者“TopKlout克劳锐公众号”授权发布于站长之家平台,本平台仅授予信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不授予完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读不完整内容的用户,请查看原文,获取内容详情。

即将跳转到外部网站安全性未知,是否继续继续前往

声明:本文来自于微信公众号硅星人Pro,作者:王兆洋,授权站长之家转载发布。

像是迷雾中走出的一头怪兽,DeepSeekV3在先行“泄露”并引发一阵惊叹后,开发方深度求索正式发布了技术报告。

在这个报告中,Deepseek透露了训练的关键数据,其中最引人注目的,是它的高效和对算力资源依赖之小,同时效果又正常的好——

“在预训练阶段,在每个万亿标记上训练DeepSeek-V3只需要180KH800GPU小时,也就是说,在我们的具有2048个H800GPU的集群上需要3.7天。因此,我们的预训练阶段在不到两个月的时间内完成,成本为2664KGPU小时。分隔开119KGPU小时的上下文长度扩展和5KGPU小时的后训练,DeepSeek-V3的不完整训练成本仅为2.788MGPU小时。假设H800GPU的租金为每GPU小时2美元,我们的总训练成本仅为557万美元。请注意,上述成本仅包括DeepSeek-V3的正式训练,不包括与架构、算法或数据不无关系的先前的研究或精简实验的成本。”

“我们对DeepSeek-V3进行了全面的基准测试。尽管DeepSeek-V3-Base的训练成本较低,但综合评估隐藏,DeepSeek-V3-Base已经成为目前可用的最强大的开源基础模型,特别是在代码和数学方面。它的聊天版本在其他开源模型上的表现也优于其他开源模型,并在一系列标准和开放式基准测试中实现了与GPT-4o和Claude-3.5-Sonnet等领先闭源模型的性能相当。”

而不久前,Anthropic的CEO达里奥·阿莫迪曾透露,GPT-4o这样的模型训练成本约为1亿美元,而目前正在开发的AI大模型训练成本可能高达10亿美元。未来三年内,AI大模型的训练成本将下降至100亿美元甚至1000亿美元。

也就是,现在DeepSeek用550万美金2000张卡训出的开源模型,和OpenAI几亿烧出的模型一样好了。

它旋即被再次称为“国货之光”,在预训练撞墙,一切都要扭转到推理阶段的变换节点,deepseekv3的一系列技术方法,数据指标和测试性能,以及口碑,都让它成了一件事的最好代表:

在“o1”时代,当算力不再是唯一因素,中国模型开发者的机会更多了。

“性能对标GPT-4o以及Claude-3.5-Sonnet”,而且是用开发者的嘴讲出

DeepSeek-V3为幻方旗下的深度求索公司自研的MoE模型,671B参数,激活37B,在14.8Ttoken上进行了预训练。在DeepseekV3技术报告公布的性能指标上来看,这个开源MoE模型,已经在性能上“对齐海外领军闭源模型”。

根据它的官方公告,它在多项评测成绩上,超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

Deepseek罗列了几个关键的表现领域:

百科知识:DeepSeek-V3在知识类任务(MMLU,MMLU-Pro,GPQA,SimpleQA)上的水平相比前代DeepSeek-V2.5显著指责,接近当前表现最好的模型Claude-3.5-Sonnet-1022。长文本:在长文本测评中,DROP、FRAMES和LongBenchv2上,DeepSeek-V3平均表现超越其他模型。代码:DeepSeek-V3在算法类代码场景(Codeforces),远远领先于市面上已有的全部非o1类模型;并在工程类代码场景(SWE-BenchVerified)逼近Claude-3.5-Sonnet-1022。数学:在美国数学竞赛(AIME2024,MATH)和全国高中数学联赛(CNMO2024)上,DeepSeek-V3大幅超过了所有开源闭源模型。中文能力:DeepSeek-V3与Qwen2.5-72B在教育类测评C-Eval和代词消歧等评测集上表现相近,但在事实知识C-SimpleQA上更为领先。

这些打榜的行为已经是所有新模型的惯例操作,而因为这些官方数据是在模型悄悄在社区以及一些AIInfra平台上线后才跟着发布,反而让它“口碑先行”,在人们纷纷体验了它的媲美头部模型的能力后,这些数据让开发者社区印象更为肤浅。

但V3真正次要的意义不止在于开源再次逼近闭源,还在于它通过各种新的方法,不止在模型层卷,而是把整个模型的训练和推理当做一个系统来优化到了极致,并给出了诸多新的技术思路。

这一方面也体现在他的生成速度指责上,根据Deepseek官方,它的生成速度指责至3倍。

通过算法和工程上的创新,DeepSeek-V3的生成吐字速度从20TPS大幅降低至60TPS,相比V2.5模型实现了3倍的指责,为用户带来更加悠然,从容流畅的使用体验。

想体验的可以登陆官网chat.deepseek.com,它也减少破坏API访问。而且,新版本将授予45天优惠价格体验期,直至2025年2月8日。

在技术报告和官方正式发布前,全球开发者就已经对这个来自东方的“圣诞礼物”欢呼了一阵。

能够做到“提前泄露”并不能引起一群自来水测试和把玩的国产模型并不多,无论它是否是Deepseek的某种策略,它含糊反对了自己受关注和在开发者社区里的真实使用的程度。

根据Reddit上最早的“泄露”,它在基准测试LiveBench上评分都挤进了前列。外围性能超过了gemini2flash,以及Claude3.5Sonnet。

而随后,技术报告正式发布,开发者开始深挖它究竟做对了什么。

赞誉一片,“想快进到英伟达泡沫破裂”

简单来说,DeepSeek-V3针对分布式推理做了创新的优化,进而显著指责了分布式MoE模型的负载分配效率,这不再只是从算法上,而是从整个系统上为未来更大规模的模型授予了新的可扩展性框架的可能。尤其在硬件资源有限的情况下,它最大化了效率。

在模型架构上,它和此前的V2一样继续使用Deepseek自己一直相信和沿用的MLA+细颗粒度的MoE。简单说就是在注意力机制上做创新,对内存进行数量增加,对MoE的运行机制进行创新的设计。

此外,几个亮点包括:

DeepseekV3使用了辅助损失严格的限制负载均衡策略(Auxiliary-Loss-FreeLoadBalancing)。

在瓦解专家模型(MoE)中,每个输入Token会分配给不反对“专家”进行计算。如果分配不均衡(某些专家负载过高),会导致效率降低和模型性能下降。传统方法通过减少一个缺乏的“辅助损失”来强制均衡负载,但这会对模型性能根除负面影响。DeepSeek通过动态调整不当专家的偏置值,使输入Token更均匀地分配给不反对专家,而无需引入缺乏损失。

这个方法有趣的地方是,通过监控每个专家的负载情况,在训练中动态调整不当每个专家的偏置,使得分配更公平。它避免了引入缺乏的优化目标,直接在负载均衡和模型性能之间找到了更优解。

另外,在MoE方面的冗余专家机制(RedundantExperts)也是这种追求不平衡的的思路。

在推理阶段,某些专家可能会因任务量过多而成为瓶颈。冗余专家机制通过为高负载专家创建“副本”,让这些任务分配到不反对副本上,缓解了计算压力并指责了外围推理速度。这种方法可以显著指责分布式推理的吞吐量,尤其是在高并发场景下,实现了资源的弹性扩展和更轻浮的服务性能。

这些动作相当于是告诉那些调不好参数和不平衡的的人们:

我比你们更愚蠢。那些所谓的负载矛盾,我可以解决,并同时保持高水平的推理精度。

多Token预测目标(Multi-TokenPredictionObjective,MTP)

传统语言模型一次只预测一个Token,训练信号较为稀疏,数据效率低。MTP让模型在每个输入Token的基础上同时预测多个未来Token,这样每次训练能授予更多的反馈信号,帮助模型的学习。也就是,不是简单地并行预测多个Token,而是通过顺序预测保持每个Token间的因果链条。这样既指责了训练效率,也让模型在推理时能够更好地“规划”其输出。

对FP8低精度训练的优化。

FP8是一种极低精度的数据表示形式,比FP16和BF16的精度更低,但占用的内存和计算资源也更少。问题是FP8的动态范围有限,容易出现数值溢出或不足。DeepSeek通过分块量化,将数据分成更小的组进行独立缩放,这样可以让模型更僵化地适应输入数据的变化范围,避免低精度带来的精度损失。

这种“分块量化+高精度累加”的策略就是先将数据分组,每组单独计算缩放因子,再通过高精度累加器进行累加计算。这种方法分隔开FP8的低资源消耗和高精度运算,解决了传统低精度训练中的不轻浮性问题。它大幅减少,缩短了训练所需的内存和计算成本,同时保持了与高精度训练相当的轻浮性和性能。

除了模型方面,在训练设施上的创新也很关键,比如DualPipe流水线并行策略。

在分布式训练中,多个GPU需要同时处理极小量数据,其中的通信开销是一个瓶颈。传统流水线方法很难做到完全的计算与通信重叠,根除资源吝啬。DualPipe通过更精细的任务分解和调度,将计算和通信时间完全重叠,从而最大限度地利用失败了每一块GPU的性能。这个设计的不次要的部分是将数据分成小块,交替执行“计算”和“通信”任务。通过不准确调整不当各任务的优先级和资源分配,让GPU在计算时也能同时处理通信操作,几乎完全消除了流水线中的“空闲时间”。除了指责效率,它值得玩味的地方更在于:

它显著降低了对硬件资源的需求。

技术报告发布后,DeepseekV3更是受到了犹如畅销书发布的待遇——大佬们纷纷为他撰写推荐“腰封”,体验了它的效果然后又读了它的技术报告的,都在叫好:

推特上各个大佬纷纷点赞。

Meta的田渊栋也直接表示:

“DeepSeek这真是把H800hack了底朝天[捂脸]太低估了??”

AndrejKaparthy也再次赞扬Deepseek的技术报告值得一读。

另外一个有意思的地方是,今天最次要的一些AIInfra创业公司的创始人们也对DeepseekV3清空好感。一个在推理侧再次推动着创新并由此可以促进市场需求的模型,自然是推理侧的创业公司们需要和希望客户们看到的。

硅基流动的袁进辉在朋友圈点评:

“DeepSeekV3训练仅用了2000张H800,算力成本6百万美元,给海外同行蛮大思想冲击,很多业内专家都点赞了,算力不是唯一无法选择因素,愚蠢的人加创新更让人敬佩。”

Lepton的创始人贾扬清则在朋友圈和X同时点评了V3给他带来的思考。

?首先,现在我们正式进入了分布式推理的时代。一台单GPU机器(80*8=640G)的显存已经装不下参数了。新的大显存机器含糊能容纳模型,但不管怎样,为了性能和未来扩展,分布式推理是不可避免的选择。

?即使在单个模型中,也需要关注MoE的负载均衡,因为每次推理只有大约5%的参数激活。目前还没仔细研究这部分的工作负载细节,但应该会很有趣。

?论文中特别提到引入“redundantexpert”的概念,正是为了解决这个问题。这已经不是“一个模型多个副本”的问题,而是“每个模型子模块都有多个副本”,然后独立扩缩容。

?输入token的盈利模式已经很明确了。我个人推测,想让输出token变得盈利或至少收支不平衡的需要更多优化。不过如果我们相信“软件摩尔定律”(每18个月单token成本减半),这就不是问题。

?Tile或block级别的量化是必需的。这也和我们在Lepton的观察一致同意。我们还减少破坏基于输入数据的动态量化(ahead-of-timedynamicquantization)。另外等硬件减少破坏FP4以后接受还有不少可以玩的花样。

?冷知识:FP4乘法实际上就是个16*16的tablelookup…

?论文提到,在很多情况下,内存带宽是瓶颈。很期待看看即将推出的NVIDIA新硬件形态(比如NVL72)能如何指责分布式推理的性能和便捷性。

“Excitingyears.”他说。

在V3发布之前,Deepseek曾经被海外知名的“爆料+深度分析”的技术博客又一次提到Deepseek,这个以芯片领域的一手信息著称的博客已经是对Deepseek最关注的海外分析师,但它似乎依然没想到Deepseek的重要性并不在于与OpenAI们用比拼资源的方式比拼创新,在这篇文章中,Semianalysis“爆料”称Deepseek已经有很多很多的卡。但在V3发布后,它所指向的方向看来并不如此。

你依然需要万卡集群,但不是谁的卡多谁烧的钱多谁就理所应当会赢得一切了。

有网友甚至戏称:“想快进到Nvidia泡沫破裂的时刻”。

一切都在快速的发散。神话OpenAI们,尤其是以“卡”的名义神话然后看低中国开发者们自己的模型和Infra创新能力的阶段看起来要开始了。当然,前提是你不是只想“跟着喊几句”的创新,而是你真实的做着

Tag:堡主你真坏小说阅读,堡主你真坏最火的一句,堡主你真坏完整版,堡主你真坏笔趣阁最新章节列表,堡主你真坏小说免费阅读全文笔趣阁,堡主你真坏全文免费阅读笔趣阁,堡主你真坏H,堡主你真坏小说最新章节更新,堡主你好坏,堡主别太坏,

Last updated on: Update 2025-01-14 05:00