智谱发布GLM-4-Air、GLM-4V-Plus模型:Flash全模态免费模型设立
近日消息,北京智谱华章科技有限公司推出了一系列新的模型,并且已经在bigmodel.cn上线。继8月推出“智谱清言”之后,该公司在语言、语音、图像以及视频的理解和生成方面进行深度的探索,陆续推出了GLM - Voice、GLM - 4V、CogView、CogVideoX等多种多模态模型。
此次发布的全新端到端模型GLM-Realtime,实现了低延迟的视频理解与语音交互,融入了清唱功能,并支持长达2分钟的记忆及Function Call功能。公司还同步升级了GLM-4-Air和GLM-4V-Plus模型,致力于提供业界最强性能和性价比的语言模型解决方案。智谱始终致力于以先进的大模型技术回馈社会,特别设立了Flash全模态免费模型,涵盖语言、文生图、文生视频及图像理解等多个场景,助力开发者轻松实现应用创新。
GLM-Realtime在视频通话上具备2分钟的内容记忆能力,语音交互方面创新性地实现了清唱功能,让大模型具备在对话中的歌唱能力。公司将Realtime API集成到智能眼镜和陪伴娃娃中,以便用户体验近乎实时的智能助手交互。Realtime进一步支持Function Call功能,能够依靠自身知识和能力,灵活调用外部知识和工具,拓展到更广泛的商业场景。GLM-Realtime API已上线智谱开放平台bigmodel.cn,现阶段免费调用。
GLM-4-Air自上线以来以高性价比受开发者欢迎,此次全面升级为GLM-4-Air-0111,通过优化训练数据和流程,在某些维度性能接近规模更大的GLM-4-Plus,同时模型价格降至原来的50%,降低大模型应用门槛。视觉理解模型GLM-4V-Plus也全面升级,新版本在多个公开榜单上效果显著提升,支持变分辨率功能,适应不同尺寸图像输入,小图场景下显著降低token消耗,支持4K超清图像和极致长宽比图像的无损识别,具备长达2小时的视频理解能力,为长视频理解和分析提供高效精准解决方案。
智谱致力于大模型普惠,为助力开发者创新,专门设置了针对全社会免费开放的Flash系列普惠模型API。作为行业首个全模态的免费系列模型,开发者可免费调用语言、多模态理解、多模态生成功能。近期Flash系列将全面升级,成员包括语言模型GLM-4-Flash、图像理解模型GLM-4V-Flash、图像生成模型CogView-3-Flash、视频生成模型CogVideoX-Flash。
智谱AI宣布《清影》AI视频生成工具上线,现已集成至智谱清言PC与APP端
近日消息,智谱AI在OpenDay活动上揭晓了其最新研发的AI大模型——清影(Ying)。该模型独树一帜,能够迅速将任何文本内容转化为视频形式,展现出非凡的创造力。
用户仅需提供文本提示,并选定心仪风格,如卡通3D、黑白默片、油画质感或电影级视觉效果,清影便能在短短30秒内生成1440x960分辨率的高清视频。目前,该技术已集成至清言App,向公众全面开放使用,标志着AI内容生成技术的又一里程碑式进步。
除了文本生成视频,清影还支持图片生成视频,带来表情包梗图、广告制作、剧情创作、短视频创作等新玩法。同时,基于清影的“照片动起来”小程序也将上线,AI能让旧照片中的人物或场景动起来。
清影API也已上线大模型开放平台bigmodel.cn,企业和开发者可以通过调用API的方式使用文生视频和图生视频的模型能力。清影采用了新型DiT模型架构,更高效地压缩视频信息,并充分融合文本和视频内容,提升了复杂指令遵从能力、内容连贯性和画面调度。
智谱AI CEO张鹏在活动中提到,清影底座的视频生成模型是CogVideoX,它融合了文本、时间和空间三个维度,参考了Sora的算法设计。CogVideoX相比前代推理速度提升了6倍,未来将推出更高分辨率、更长时长的生成视频功能。
用户可以通过智谱清言PC/APP上的“清影智能体”直接体验清影,将脑中的灵感转化为艺术视频创作。
智谱AI重磅发布:GLM-4-Plus-VideoCall API申请通道开启,革新视频通话体验
近日,智谱AI宣布其最新进展,视频通话功能的API——GLM-4-Plus-VideoCall已在开放平台上架并启动申请程序,为开发者带来更强大的通信集成工具。此更新与游戏领域相结合,或将开启视频互动体验的新篇章。
据介绍,这是清言视频通话背后的模型,能够实现视频通话和语音多轮交互等跨模态能力,有望成为推动人机交互革新的新范式。
此前,北京智谱华章科技有限公司最新研发的基座大模型GLM-4-Plus正式上线,并已部署在其开放平台bigmodel.cn。GLM-4-Plus在代码计算、数据分析、图像和视频特征识别等多个领域都实现了性能的显著提升,同时降低了成本。
为了推动AI技术的普及,智谱科技不仅免费提供了GLM-4-Flash,还为新老客户提供了1亿tokens的免费额度,并提供了最高1折的API折扣。同时,智谱科技还提供了模型微调功能,以满足不同用户的需求。
复制本文链接 攻略文章为肉团资源网所有,未经允许不得转载。
-
智谱AI引领开源创新:CodeGeeX4-ALL-9B代码生成大模型震撼发布
肉团资源网 2024-12-19 15:23
-
中国的人造太阳有重大突破,创1亿摄氏度1000秒纪录
肉团资源网 2025-02-27 04:10
-
马来西亚与中国强化半导体联盟,10月共襄2024亚太半导体盛会:峰会与博览会启航
肉团资源网 2024-10-18 04:22
-
Meta CEO扎克伯格确认,年内将面世全新AR眼镜,拓展现实边界
肉团资源网 2025-04-13 10:01
-
苹果M4 MacBook Pro新动态:显示面板本月悄然出货,Q4季度发布盛宴即将启幕
肉团资源网 2024-09-02 00:53
-
Redmi Note 14 Pro+强势登场:6200mAh硅碳电池搭配90W疾速快充技术
肉团资源网 2025-01-14 23:09