本次评测中,我们对五款具有代表性的国产文生***工具进行了初步测试:快手的可灵大模型、抖音的即梦、智象未来的千象、爱诗科技的pixVerse、以及美图的WHEE。
为了测试各种AI大模型在天生***时的能力,我们让ChatGPT设计了一个涵盖多种场景、感情、细节和风格的繁芜提示词。毕竟ChatGPT也是大模型出身,会不会对他们内部的逻辑更理解一些。以下为ChatGPT设计的提示词:
“在一个宁静的秋日薄暮,太阳缓缓西沉,天空被染成橙赤色。镜头从一片金黄色的野外开始,微风轻拂,树叶在空中缓慢地飘落。远处有一条小河,河水清澈见底,映照着晚霞。镜头逐渐拉近,来到一座古老的石桥旁,桥上有一位身着古典长袍的老人,手握竹杖,正瞩目着河水,仿佛在思虑着什么。溘然,一群白鹭从河边的芦苇丛中飞起,冲破了这片宁静。全体画面充满了温暖的色调,带给不雅观众一种宁静而又深邃的觉得。”

提示词紧张想测试以下几点
场景繁芜度:评估模型在多层次场景描述中的表现。细节呈现:测试模型在天生自然元素(如树叶、河流、动物等)和人类情绪(如老人沉思)时的精准度。光影和色彩处理:测试模型在光影变革、色调处理和动态效果上的表现。连续性:评估天生***的连贯性和叙事性。通过这个提示词,您可以不雅观察各大模型在视觉效果、故事表达、情绪渲染、细节处理等方面的利害,进而理解它们的实际能力和适用场景。
1. 可灵大模型(Kuaishou KLing AI)
优点:
场景构建:可灵在场景繁芜度的处理上表现精良,特殊是在多层次场景的渲染上,细节丰富,层次感强烈。它能够精准地捕捉并表现出提示词中的自然元素,如河流、树叶和光影变革。感情表达:可灵对付场景感情的把握较为到位,能够渲染出提示词所哀求的宁静与怀旧感。缺陷:
理解力:无法理解繁芜的描述,以至于老人、白露都不见踪影。2. 即梦(Douyin JiMeng)
即梦是这次测试里唯一能供应长达12秒的选项。
优点:
细节呈现:即梦在细节处理上表现突出,能够非常准确地呈现提示词中的小细节,人、夕阳、桥、白鹭等都能精准表示。光影处理:在光影和色调的表现上,即梦具备精良的动态效果。缺陷:
场景繁芜度:在处理多层次场景时,即梦有时会显得有些力不从心,特殊是在快速场景转换中,画面细节的表现力有所低落,觉得比较破碎。3. 千象(HiDream.AI)
优点:
整体连贯性:千象在***连贯性上有着极佳的表现,叙事流畅,镜头切换自然,能够很好地保持***的整体节奏感。缺陷:
理解力:和可灵一样,缺少对付繁芜提示词的理解能力,以至于老人和桥在画面中不见踪影。4. pixVerse(AiShi PixVerse)
优点:
创意表现:pixVerse的AI模型在创意表现上极为出色,能够根据提示词天生独特而富有艺术感的画面,适宜须要高度艺术化效果的创作者。色彩利用:该工具在色彩利用上表现惊艳,能够精准匹配提示词中的色调哀求,画面饱满且富有视觉冲击力。缺陷:
细节精度:由于过于强调创意表达,pixVerse在某些细节的表现上有所欠缺,特殊是一些须要风雅处理的自然元素表现稍显模糊。5. WHEE(Meitu WHEE)
优点:
用户友好性:WHEE的操作界面直不雅观,用户体验极佳,适宜没有技能背景的用户利用,其天生速率也较为空想。缺陷:
理解力:和可灵、千象一样,缺少对付繁芜提示词的理解能力,以至于老人、桥、白鹭在画面中不见踪影。总结
在这次测试中,可能是由于ChatGPT设计的提示词过于繁芜,导致可灵、千象、WHEE都是属于翻车状态,没能表示出提示词里的主要细节。唯二完成任务的即梦和pixVerse从画面感上又比其他几款略逊,也可以算各有千秋。相信各家在逐步打磨产品之后,表现力会越来越好,喜好尝鲜的朋友可以都去试试。至少目前对免用度户都比较友好,每天都会给一些点数来考试测验。
下面把五个***剪在一起了,大家可以根据详细的创作需求,选择最适宜的工具,将能更好地发挥这些文生***工具的上风。
***加载中...
可灵大模型在场景细节和感情表达上表现出色,适宜须要高度风雅化场景的用户。即梦善于细节呈现和光影处理,适宜对视觉效果哀求较高的项目。千象则在连贯性和多场景处理上表现突出,适宜须要做繁芜叙事的内容创作。pixVerse适宜追求创意和艺术表达的用户,但在细节精度上略有欠缺。WHEE则在用户体验上有独到之处。