盖世汽车讯 人工智能图像生成——依靠神经网络根据各种输入创建新图像——预计到本世纪末将成为一个价值数十亿美元的产业。即使以今天的技术,如果想要创作一幅奇特的画面,比如一位朋友在火星上插上国旗,或者漫不经心地飞进黑洞,也只需不到一秒钟。
然而,在图像生成器能够执行此类任务之前,它们通常需要接受海量数据集的训练,这些数据集包含数百万张图像,通常还配有相关文本。训练这些生成模型可能是一项艰巨的任务,需要数周甚至数月的时间,并且会消耗大量的计算资源。
但是,如果真的可以通过人工智能方法生成图像,而无需使用生成器,那会怎样呢?
据外媒报道,2025年夏初,在加拿大不列颠哥伦比亚省温哥华举行的国际机器学习大会上,一篇研究论文阐述了这种现实可能性以及其他一些引人入胜的想法。研究人员重新构想图像生成,使标记器和解码器无需生成器即可进行编辑和修复图像。相关论文已发表在arXiv预印本服务器上。
论文由麻省理工学院信息与决策系统实验室(LIDS)研究生研究员Lukas Lao Beyer、麻省理工学院计算机科学与人工智能实验室(CSAIL)博士后研究员Tianhong Li、Facebook人工智能研究中心的Xinlei Chen、麻省理工学院航空航天学教授兼LIDS主任Sertac Karaman以及麻省理工学院电气工程与计算机科学副教授Kaiming He共同撰写。
这项团队研究的起源是Lao Beyer去年秋季参加的深度生成模型研究生研讨课的课堂项目。在学期中的交流中,Lao Beyer和研讨课的授课老师He都意识到这项研究具有真正的潜力,远远超出了普通家庭作业的范畴。很快,其他合作者也加入了进来。
Lao Beyer的研究起点是一篇发表于2024年6月的论文,该论文由慕尼黑工业大学和中国公司字节跳动的研究人员共同撰写,该论文介绍了一种新的视觉信息表示方法,称为一维标记器。利用这种设备(它也是一种神经网络),可以将256x256像素的图像转换为仅由32个数字组成的序列,这些数字被称为标记。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。
宝马发布全新智能电子电气架构,超级大
近日,宝马正式推出全新一代智能电子电...
莲花跑车EmiraGT4携星速车队征
传承赛道基因,唤醒速度传奇。F1中国...
AudioLab音响榜:车企汽车音响
新的一年,AudioLab为了给大家...
六年车型销量TOP15变迁,见证车市
回首国内汽车行业近十年历程,2018...
汽车行业大事件频出,政策与合作双轮驱
近期,汽车行业各类动态精彩纷呈。3月...
2025款小鹏G6与G9震撼上市,A
在春天,小鹏汽车举办了一场备受瞩目的...
蔚来firefly萤火虫首款小型车4
近日,我们从相关渠道获取了蔚来第三品...
2025年1月智能座舱供应商排名:国
2025年1月,智能座舱市场竞争呈现...
比亚迪超级e平台发布:兆瓦闪充领航油
3月17日,比亚迪举办了一场备受瞩目...
京东汽车携手郑州日产:共筑汽车后市场
3月17日,京东汽车与郑州日产汽车销...
港车北上创新高,粤车南下将启航
在香港与内地日益紧密的交流浪潮中,交...
北京越野:6大越野路线,15重权益护
2025年3月18日,以“路见远方,...
中国电动汽车百人会论坛2025聚焦产
在过去的2024年,中国经济展现出强...
别克25款昂科威S白金版上市:高性价
3月18日,别克迎来重要时刻,25款...
山海炮穿越版长续航豪华皮卡,驭享春日
仲春时节,大地回暖,蛰伏一冬的泥土中...
中国重汽新能源实力领航,多领域诠释真
2025年,中国重汽新能源在新能源商...