186. 新建文件夹:扩散模型

上一页返回目录下一页
最新网址:www.umixs.info

    他计划最近开发的,便是后来非常火热的一款图片生成技术,Stable Diffusion的基础部件,diffusion原理。

    这是后来许多优质生成技术的基石,非常适合现在做准备。

    扩散(diffusion)模型,这个比较不明觉厉的名词,虽然后来知晓原理的人很少,但很多人却都听过这个名词多次。

    从AI绘图软件生成的作品打败一众人类艺术家,斩获数字艺术类冠军,到后来Midjourney,、Imagen、novelai等国内外平台遍地开花。

    越来越多的人都曾点开过相关网站,尝试让AI描绘脑海中的画面,又或者是进行局部的修改调整。

    有以文生图,各种神秘咒语召唤古神的,也有以图生图,闹出各种神奇笑话的。

    2022年,AI绘画,AI生成图像,在短短几个月内数次进步。

    每一次的进展突破都带了了肉眼可见的提升,远超人类的想象。

    就在22年年关左右的时候,大家都还在嘲笑AI绘图是什么东西,实在太过丑陋了。

    结果三个月后就发现事情似乎没有那么简单,AI开始大量产出各种波涛胸涌的绘图,这吸引了相当一部分人们的注意力。

    那时不少人还在开玩笑说,虽然AI画得不行,但你真别说,它对题材的把握还是非常不错的嘛!水平不够,题材来凑。

    等再过三四个月,到22年底的时候,AI绘画的水平和能力已经无人再去争议了。

    这回大家主要争论的点又变了,变成了AI绘图究竟是不是抄袭,AI水平和画师究竟谁更强。

    抛开到底谁更强这件说不清的事不谈,单从大家争论的这些内容就能看出,AI绘画的能力确实进步得非常之快。

    “平心而论,在AI生成这件事情上,GAN生成式方法是让大家走了弯路的。”

    虽然孟繁岐的GAN生成式办法在学界广受好评,建立起了很高的学术声誉和知名度,FaceGAN的假脸生成效果也颇为惊艳,但最终真正让AI制图火起来的还是扩散模型。

    “GAN办法生成对抗的模式固然让人感到惊为天人,但两个网络彼此对抗学习,毕竟还是非常麻烦的事情。”孟繁岐思忖了一下,现在的大难题,数据是一方面,计算设备则是另一方面。

    本来自己提前发布技术,显卡就已经很不够用了。目前用GAN去针对某一个特定的事物,比如FaceGAN只做人脸还是比较可以的,但想要从文本直接生成,那难度可就大了。

    扩散模型的原理其实并不难,主要是通过对照片添加噪声,然后在这个过程中学习到当前图片的各种特征。之后再随机生成一个服从高斯分布的噪声图片,然后一步一步的减少噪声直到生成预期图片。

    代码写起来不是那么困难,不过若是写成论文,琢磨其中的原理,那里面的数理逻辑和推导,够孟繁岐喝一壶的。

    “数学这方面....这两天找韩辞和付院长他们帮帮忙吧,好久没怎么跟他们联络了。或者也可以请辛顿和李飞飞指点一下,这两位都算是我的导师。”涉及数学问题,找数学专业人才自然放心。

    李飞飞和辛顿虽然不是数学出身,但李飞飞有物理背景,辛顿更是领域内教父,两者在这方面实力想必也很强。

    新建了文件夹,孟繁岐刚准备开始工作,却隐约感觉哪里不对,自己好像遗忘了什么事情。

    半晌才想起来,自己的倒霉室友唐璜今天要到斯坦福附近来。

    “这大半年过的,差点忘记我自己还是个学生了。”

    高强度研发了三四个月的孟繁岐,感觉时间好像已经过去了一年多。

    正好唐璜来了,就给自己放几天假吧,来了也有几周了,却一直没有好好逛过斯坦福的校园。

    时隔多月,孟繁岐也算是终于被迫静下心来,有了足够的时间做一些基础的理论方法,而不是急于做产品又或者是变现。

    毕竟,往后的技术不管是AI生成语音,图像还是文本,目前的这些技术理论还有不小的缺陷和问题。

    即便加州相关方面的教授集体支持,积累数据的速度仍旧远远要比孟繁岐所想的慢不少。

    阿尔法fold项目的正式开启时间,至少要往后延一到两个月。

    因而在开学前的这段时间,孟繁岐的蛋白质分析大计不得不进入了一段时间的停滞期。

    即便他们能够及时调转车头,开始进行优质数据的积累和标注,肯定也是要一段时间的。

    数据跟不上,孟繁岐即便理论再好,却也难做出足够好的效果,不足以让人信服。

    “我也算是搞了好个月的应用技术了,现在数据上要等一两个月,看来是时候做点基础工作,为以后铺垫了。”

    为此,他私下里和孟繁岐聊过两三次,大概了解了原理,也为他协调提供了不少数据作为支持。

    有一次,刘勇教授向孟繁岐询问道:“既然人工智能已经可以对图片中病变的种类,区域和轮廓都做出如此准确的分析判断,那能不能帮忙把医嘱或者文字分析也给写了?”

    孟繁岐听完顿时语塞,没想到刘教授接受新事物的速度还挺快,已经做上白日梦了这是。

    “技术提的太快,就是会碰到这种问题。”孟繁岐有些无可奈何,别说很多领域还来不及接受和消化自己做出的能力提升。

    这些地方原本积累的那点数据在新的技术面前,完全不够看,数量实在太少了。

    总体来说,斯坦福医学派系对本校学生的的突破相当热情,借助着加州这两所顶级高校的影响力,孟繁岐的成果正在慢慢地向外辐射。

    只不过大量数据的准备,并不是区区几天就可以有显着成效的。

    斯坦福肿瘤方向的教授刘勇使用了这系列算法之后,感到十分惊奇,这电脑明明一两年前才刚刚学会分辨什么是猫,怎么现在突然就这么生猛了?

    尤其是比较难一点的病症,自己带的几个学生分辨起来一看就是十几二十分钟,这东西倒好,几秒钟就能给出一个答复。

    斯坦福的其他医学教授,比如杰佛雷主任等人则非常看好孟繁岐阿尔法fold项目,尤其是杰佛雷,他曾经担任二十多个临床药物研究的首席调查员,因而非常能够理解这种蛋白质分析能力的价值。

    杰佛雷是个大脑门,有点胖乎乎的中年男子,满面红光,对待学生十分热情。

    在得知孟繁岐的阿尔法fold项目很是缺乏高质量的蛋白质数据之后,也非常积极踊跃地提供了协助。

    他只得实话告诉刘教授,别说语言和图像的结合的多模态了,目前语言模型本身都仍旧是一个相对急需突破的领域。

    想要实现他需求的功能,恐怕还得几年。

    除去孟繁岐在华国时推行的人脸识别方法已经大行其道,最近他在医疗影像诊断分析领域的一系列工作,其实也已经在加州的圈子里率先展开了试用。

    那句话怎么说来着,【获得了几百名教授一致通过】。

    尤其是湾区附近两所最顶级的高校,斯坦福和伯克利两个派系。由于他们在人工智能比较没落的时候仍旧坚持研究,因而也对这些迟到的果实感到格外珍惜。

阅读重生之AI教父最新章节 请关注完美小说网(www.umixs.info)



随机推荐:打脸是门技术活炼明大秦之万代帝王都市之最强仙道重生之追爱少女火影之超级副本

上一页返回目录下一页
推荐本书加入书签报告错误