在大家被ChatGPT和Midjourney所惊艳之后,如今又惊叹于妙鸭相机的写真能力!它到底用到了什么AI技术才做到这么厉害的呢?本文就带大家来探索一下!01AIGC关键技术无论是ChatGPT,还是Midjourney、妙鸭相机,都属于人工智能创造内容(AI Generated Content,AIGC)!AIGC有两项关键技术:一个是ChatGPT所代表的大模型(Large Language
作者 | 刘鹏飞背景随着人工智能技术的持续进步,生成式人工智能服务(例如ChatGPT)正逐渐成为信息传播与创意生成的重要工具。但值得注意的是,这种技术容易产生与事实不符的内容,提供看似合理却不准确的答案(例如:虚构不存在的法律条款来回答用户的法律咨询,编造疾病的治疗方案来回复患者)。在这个充满创新和潜力的领域,确保生成内容的真实性,不仅是一个需要解决的技术问题,也是决定着技术能否真正落
梦晨 西风 AI又在玩一种很新的艺术。一组“在离谱与合理的边缘反复试探”的图席卷各大平台,最火的一条?已有近700万查看16.8万点赞,到处有人在求教程。除了棋盘样式,还有一种螺旋样式的也很流行。连知名投资机构Y Combinator的创始人Paul Graham都来围观:这一刻,AI生成的艺术通过了我的图灵测试。不少网友更是在讨论中提到:这些AI作品给人一种错觉图形大师埃舍尔的感觉。也更进一步证
公众号【机器学习与AI生成创作】What I cannot create, I do not understand.——Richard Feynman来自诺贝尔物理学奖获得者费曼的这句话,一直在叩响着人工智能研究者的内心,OpenAI的研究也一直秉承着一个核心愿望,那就是“开发算法和技术,让计算机了解我们的世界。”目前有两种方式来让计算机了解我们的世界,那就是监督学习和无监督学习。其中,监督学习虽
继各类输入端多模态大语言模型之后,新加坡国立大学华人团队近期开源一种支持任意模态输入和任意模态输出的真正「大一统」多模态大模型,火爆 AI 社区。ChatGPT 的诞生,引爆了 2023 年的基于大语言模型的 AI 浪潮,此后各类开源大语言模型陆续问世,包括 Flan-T5、Vicuna、 LLaMA、Alpaca 等。随后,社区继续发力,为模拟这个多模态的世界,研究者们将纯语言的大模型扩展到了处
编辑:张倩我们离真正的「AI 电影」不远了?Midjourney 是很多人都在使用的一款文生图工具。结合最近更新的视频生成工具 Runway Gen2,你甚至可以自己制作一个电影预告片,最近社交媒体上很火的《Trailer: Genesis》(《创世纪》)、《流浪地球 3》电影预告片都是借助这些 AI 工具生成的。不过,这些「预告片」都有一些局限,比如时长短、画面缺乏变化。要想克服这
编辑:桃子【新智元导读】有了??????-?-??????,不是艺术家,也成艺术家。只需随笔一画,高清画作就来了。比如,画一个中世纪城堡,简单画个门,画条路,一座美丽的城堡出现了。带邮箱的霍比特人房子海洋边缘的灯塔(PS:有点像海底星空)来自斯坦福的研究人员提出了??????-?-??????,一个能够将草图变成画作的模型。甚至,??????-?-??????可将生成的图像,转换成完整的草图,还
公众号 QbitAI阿里开源大模型,又上新了~继通义千问-7B(Qwen-7B)之后,阿里云又推出了大规模视觉语言模型Qwen-VL,并且一上线就直接开源。具体来说,Qwen-VL是基于通义千问-7B打造的多模态大模型,支持图像、文本、检测框等多种输入,并且在文本之外,也支持检测框的输出。举个?,我们输入一张阿尼亚的图片,通过问答的形式,Qwen-VL-Chat既能概括图片内容,也能定位到图片中的
.
001 (2023-08-30) SignDiff Learning Diffusion Models for American Sign Language Production https://arxiv.org/pdf/2308.16082.pdf002 (202 Ster...
可以说,AI 初创公司 LinkSoul.Al 的这些开源项目让海外开源大模型在国内的普及和推广速度与国际几乎保持了一致。来源丨机器之心7 月 19
本文来源 机器之心编辑部真实场景超分中 GAN 带来的瑕疵困扰你吗下的瑕疵类型。而当这些方法应用于真实世界场景中时,我们观察...
一分钟视频:Learning A Sparse Transformer Network for Effective Image Deraining项目:https://github.com/cschenxiang/DRSformer
文生图在最近一年取得了显著的进步,DreamBooth 定制化生成工作,进一步证明了文生图的潜力,并且广泛引起了社区关注,相比于单概念生成,在一张图内定制多个概念是更加有趣且具有广泛应用场景(AI 影楼,AI 漫画生成....)。相比于单概念定制生成取得的成功,阿里提出的 Cones 和 Adobe 提出的 Custom Diffusion 作为现有的多定制概念生成方法仍存在两个挑战:首先,他们需
001 (2023-08-4) Painterly Image Harmonization using Diffusion Model httl autoencoder for crystal...
4变笨实锤了?斯坦福4性能骤减早有端倪。有网友甚至把3小时25条额度一口气用完,也没有解决...
机器之心 编辑:Panda WLLM 面临哪些挑战又有哪些应用?
明敏 克雷西 发自
本 公众号 QbitAI传奇大神何恺明,最是为AI而生的!除此...
prompt在视觉领域,也越来越重要,在图像生成,作为一种可控条件,增进交互和可控性,在多模态理解方面,指令pro
论文:Inversion-Based Style Transfer with Diffusion Models代码:https://github.com/
来源 | CNUR编辑:双一流高教6月16日,2023年中国大学评级于中国大学排行榜官网(CNUR)正式发布。该评级面向内地846所公办
疗、教育等应用领域。扫码加我微信,回复“比赛”领取比赛T...
19.pdf002 (20...
来源:深度学习自然语言处理本文约9900字容和这个问题很契合,所以这里我以这个报告框架为蓝本,略作更...
ench构建:设计了GenBench,一个包含22个数据集和2548...
中嵌入水印。或许,天天被DeepFake骗的团团转的日子,要一去不复返了!七大巨头联手给AI加水印还记得十几年前,总有...
0 亿和 700 亿参数版本,训练数据比 Llama 1 多了 40%,达到了 2 万亿 to...
截个图给大家看一下无论是为了面试,为了打比赛还是入门学习一些算法,我还是挺建议前期按照各类题型逐个击破,这份刷题笔记,或许可以给大家带来一些帮忙。我简...
Copyright © 2005-2023 51CTO.COM 版权所有 京ICP证060544号