栏目分类
你的位置:开云(中国)Kaiyun·体育官方网站-登录入口 > 新闻中心 > 开云下载网址Vidu Q1 增多了可控主体数目-开云(中国)Kaiyun·体育官方网站-登录入口
开云下载网址Vidu Q1 增多了可控主体数目-开云(中国)Kaiyun·体育官方网站-登录入口
发布日期:2025-03-31 04:39 点击次数:75


2024年4月,清华大学东说念主工智能推敲院副院长、生数科技首创东说念主兼首席科学家朱军初度发布中国版Sora——视频大模子Vidu。一年后,2025年3月29日,中关村论坛上,Vidu高可控 AI 视频大模子 Q1崇敬推出。
这次升级的关节在于“高可控”,采访中,朱军阐扬称:Q代表quality,代表模子的高可控,具体包括多主体细节可控、音效同步可控、画质增强。履行视频生成经由中,位置可控一直是难办痛苦,以往模子时时无法精确按照提示生成。如今,Vidu Q1 借助融入参考图的视觉提示,在语义提示的基础上,罢了了对场景中脚色位置属性的更精确适度。
可控主体数目的增多亦然一项时刻冲破。以往,AI 视频生成在靠近较多主体时,精确生成的难度极大。Vidu Q1 增多了可控主体数目,并在多主体一致性以及相宜物理章程等方面罢了冲破。另外,Vidu Q1 的音效同步可控功能不错基于语义提示,在生成视频画面的同期生成精确可控的音效,适度每段音效的短长与出现的时分点。
从Vidu1.0到Vidu Q1,一年时老实,大说话模子赛说念渐渐参预洗牌期,而视频大模子赛说念仍处于隆盛成长久,快手可灵、字节即梦、MiniMax海螺AI束缚迭代,OpenAI Sora崇敬上线,HeyGen、Pika、爱诗科技等完成融资。而总计这个词东说念主工智能领域追随时刻的升级,发展旅途渐渐从单一模态跨向多模态、跨模态,东说念主机交互与产业应用的领域渐渐更正。
相较视频大模子专注于视频数据的特征,多模态大模子可惩处文本、图像、视频等多种数据,通过数据对皆、交融与长入记号时刻,引申视觉问答等复杂任务。关于多模态赛说念的发展,朱军对第一财经记者示意,Vidu基座一运行便是多模态大模子,生数的定位亦然多模态,视频仅仅推崇阵势之一,这次更新的音频功能与机器东说念主可控数据操作均代表着不同的模态,对公司来讲,底层架构基本相同,不消过多修改即可罢了多种模式。
当今生数Vidu的交易化意见主要包括面向C端的SaaS与面向B端的MaaS模式,朱军以为,2025年是视频大模子交易化快速发展的一年,奢靡者对视频的需求额外普遍,这亦然视频大模子与大说话模子不同之处。朱军判断,当今头部视频模子平台各有特质与交易化旅途,暂时莫得走到大说话模子那么“卷”的现象。
谈及DeepSeek效应是否会在视频赛说念出面前,朱军对记者示意,视频大模子粗略率不会出现雷同DeepSeek这种效果超越的模子,因为行业还是将DeepSeek主打的效果上风进行实践了,厂商更期待的是视频模子愈加可控、愈加好用,步入视频领域的“ChatGPT时刻”。
举报 第一财经告白相助,请点击这里此内容为第一财经原创,文章权归第一财经总计。未经第一财经籍面授权,不得以任何花样加以使用,包括转载、摘编、复制或确立镜像。第一财经保留讲究侵权者法律包袱的权益。如需得到授权请推敲第一财经版权部:banquan@yicai.com 文章作家
吕倩
推敲阅读据悉该模子参数为6850亿。
236 03-25 07:58
AI进化速递丨可灵AI全面接入DeepSeek国合署:打造数字经济、东说念主工智能等援外新品牌;英特尔新任首席引申官揣度打算对制造和东说念主工智能业务进行全面纠正;百度文小言全面接入文心最新大模子和DeepSeek。
32 03-17 20:47
退出“超大基模”烧钱赛,李开复现身修起零一万物近况退换之后的零一万物不再考试万亿参数领域的超大基模,但仍会不绝作念轻量化模子。
61 03-17 19:39
跨境电商试练AI,DeepSeek取代了ChatGPT在这场莫得浩荡叙事的变革里,每个参与者都在尽可能触摸AI应用新的神色。
258 03-12 19:30
安徽启程点应用DeepSeek等大模子时刻推出16个场景应用安徽省启程点在世界省级层面完成DeepSeek满血版(671B)土产货化部署,推出无判袂综窗、公文写稿、语音转笔墨等16个典型应用开云下载网址,并在全省试用引申。
29 03-11 14:31 一财最热 点击关闭
