1.Pythonå¹è®è¯¾ç¨åªå®¶å¥½ï¼
2.SELF演讲实录 | 陈科:基因测序未来只需一千
3.水无常形——开源围棋 AI 软件 KataGo 安装使用指南
4.柯洁被打败,中美人工智能的战争才刚刚开始吗?
5.腾讯T2I-adapter源码分析(1)-运行源码跑训练
6.机器人能治理国家吗?换言之,机器人能取代美国总统吗?
Pythonå¹è®è¯¾ç¨åªå®¶å¥½ï¼
ä¸åæºæ课ç¨å®æä¸åï¼æ¯ä¸ªäººéæ±ä¸ä¸æ ·ï¼éæ©ä¸ä¹æ¯åå¨å·®å¼ï¼å»ºè®®æ ¹æ®èªèº«éæ±ï¼å®å°ä½éªä¸ä¸ã
课ç¨å®æï¼
é¶æ®µä¸ï¼Pythonå¼ååºç¡
Pythonå ¨æ å¼åä¸äººå·¥æºè½ä¹Pythonå¼ååºç¡ç¥è¯å¦ä¹ å 容å æ¬ï¼Pythonåºç¡è¯æ³ãæ°æ®ç±»åãå符ç¼ç ãæ件æä½ãå½æ°ãè£ é¥°å¨ãè¿ä»£å¨ãå ç½®æ¹æ³ã常ç¨æ¨¡åçã
é¶æ®µäºï¼Pythoné«çº§ç¼ç¨åæ°æ®åºå¼å
Pythonå ¨æ å¼åä¸äººå·¥æºè½ä¹Pythoné«çº§ç¼ç¨åæ°æ®åºå¼åç¥è¯å¦ä¹ å 容å æ¬ï¼é¢å对象å¼åãSocketç½ç»ç¼ç¨ã线ç¨ãè¿ç¨ãéåãIOå¤è·¯æ¨¡åãMysqlæ°æ®åºå¼åçã
é¶æ®µä¸ï¼å端å¼å
Pythonå ¨æ å¼åä¸äººå·¥æºè½ä¹å端å¼åç¥è¯å¦ä¹ å 容å æ¬ï¼HtmlãCSSãJavaScriptå¼åãJquery&bootstrapå¼åãå端æ¡æ¶VUEå¼åçã
é¶æ®µåï¼WEBæ¡æ¶å¼å
Pythonå ¨æ å¼åä¸äººå·¥æºè½ä¹WEBæ¡æ¶å¼åå¦ä¹ å 容å æ¬ï¼Djangoæ¡æ¶åºç¡ãDjangoæ¡æ¶è¿é¶ãBBS+Blogå®æ项ç®å¼åãç¼ååéåä¸é´ä»¶ãFlaskæ¡æ¶å¦ä¹ ãTornadoæ¡æ¶å¦ä¹ ãRestful APIçã
é¶æ®µäºï¼ç¬è«å¼å
Pythonå ¨æ å¼åä¸äººå·¥æºè½ä¹ç¬è«å¼åå¦ä¹ å 容å æ¬ï¼ç¬è«å¼åå®æã
é¶æ®µå ï¼å ¨æ 项ç®å®æ
Pythonå ¨æ å¼åä¸äººå·¥æºè½ä¹å ¨æ 项ç®å®æå¦ä¹ å 容å æ¬ï¼ä¼ä¸åºç¨å·¥å ·å¦ä¹ ãCRM客æ·å ³ç³»ç®¡çç³»ç»å¼åãè·¯é£å¦åå¨çº¿æè²å¹³å°å¼åçã
é¶æ®µä¸ï¼æ°æ®åæ
Pythonå ¨æ å¼åä¸äººå·¥æºè½ä¹æ°æ®åæå¦ä¹ å 容å æ¬ï¼éèéååæã
é¶æ®µå «ï¼äººå·¥æºè½
Pythonå ¨æ å¼åä¸äººå·¥æºè½ä¹äººå·¥æºè½å¦ä¹ å 容å æ¬ï¼æºå¨å¦ä¹ ãå¾å½¢è¯å«ãæ 人æºå¼åãæ 人驾驶çã
é¶æ®µä¹ï¼èªå¨åè¿ç»´&å¼å
Pythonå ¨æ å¼åä¸äººå·¥æºè½ä¹èªå¨åè¿ç»´&å¼åå¦ä¹ å 容å æ¬ï¼CMDBèµäº§ç®¡çç³»ç»å¼åãIT审计+主æºç®¡çç³»ç»å¼åãåå¸å¼ä¸»æºçæ§ç³»ç»å¼åçã
é¶æ®µåï¼é«å¹¶åè¯è¨GOå¼å
Pythonå ¨æ å¼åä¸äººå·¥æºè½ä¹é«å¹¶åè¯è¨GOå¼åå¦ä¹ å 容å æ¬ï¼GOè¯è¨åºç¡ãæ°æ®ç±»åä¸æ件IOæä½ãå½æ°åé¢å对象ã并åç¼ç¨çã
SELF演讲实录 | 陈科:基因测序未来只需一千
小时经常会有人说,陈科你长得这么像你爸爸;也会有人说,陈科,你像你妈妈多一点。p2p借贷平台源码那为什么会这样呢?学过生物的人都知道,因为我们的DNA,也就是碱基,一半来自爸爸,一半来自妈妈。毫无疑问,我们的面貌特征是他们结合以后的体现。实际上,不仅仅体现在面貌上,我们的身高,我们的胖瘦,还有我们自己是否容易患上某种疾病,都跟我们的基因是密切关联的。我们来看一张万人迷的照片。我想大部分人对他都不会陌生,没错,他就是贝克汉姆。他从我们基因组学的术语来讲是由1×^个细胞组成。每一个细胞从外到内,分别由细胞膜、细胞浆和细胞核三大部分组成。
所谓的细胞核,顾名思义就是核心,是细胞最主要的成分,细胞是构成生命世界中每一个有机体的基本单位。那么细胞的细胞核再往下分是什么样的状态呢?这就是刚刚黎耕老师讲到的,年的时候人类发现DNA双螺旋结构。所以由大到小观察,从细胞核、染色体,再到DNA。DNA是最基本的单元,我们称之为碱基,它有ATGC四种类型。换句话说,我们是由这四种结构的DNA构成的。3.2×^9个碱基对,这就是我们人类基因组的DNA数目。
刚刚是从宏观到微观,从贝克汉姆到碱基DNA来进行观察;再反过来看看是怎样的过程?首先是四种DNA,最基本成分叫ATGC,他们形成一定的序列;再往上,有功能的序列我们称之为基因,基因与包含在基因周边的蛋白质,我们把它称为基因组;基因组构成了细胞核,细胞核是细胞的主要成分,细胞往上走,形成了器官,形成了系统;比如说我们的呼吸系统,血液系统,消化系统;到最后,贝克汉姆组装完毕,这就是由微观到宏观的过程。
这个过程的奇妙之处在哪儿呢?比如大家可能会问基因是什么、有什么作用?我们的生物学教科书里面有这样一个所谓的“中心法则”,从碱基或者说DNA开始,到RNA,到蛋白质,这个过程最终的目的是形成蛋白质。孩童的微笑,情侣之间的眉目传情,我在这里讲,您在下面听,所有的动作都是我们的蛋白质在执行功能。
DNA如此重要,它被称之为我们生命的源代码,这个源代码给予我们所有的活动,这些活动都能够回溯到DNA上去,因此我们可以从DNA中找到某种问题的原因,来解释它。
正是因为基因组的重要性,人类科学家开始联合起来进行研究。在上个世纪年代,确切来讲是年,以美国和英国为首的遗传学领域科学家们联合起来发起了人类基因组计划,这个计划简称叫HGP,由六国科学家组成。
当时计划用年的时间,测序一个人的基因组。为什么要花这么长的时间呢?因为我们基因组的大小是3.2×^9个序列,而且其中%以上是基因间区。换句话说它里面有很多的重复序列,这种重复序列的存在导致了我们想把它从3.2×^9的过程完全弄清楚是不太容易的。
人类基因组计划从年开始启动,到年,美国总统先生说我们完成了人类最伟大的计划之一,再到现在,这个版本已经更新到了第版,最新更新时间是年月。我们预计它的更新还会持续,只能说更新幅度越来越小,我们离真相越来越近。
自从人类基因组计划启动之后,相关测序产业也是蓬勃发展,直接作用就是我们可以了解更多物种的基因组是什么样子。到现在为止,棋牌网站源码购买有将近一万个物种已经有了自己的基因组。
不做基因组的人可能不太清楚,总统先生和黑猩猩有多少相似度?刚才猜测%、%、%、%的人都有,事实上是%。那么从基因组学这个角度来看,当我们认为自己多么与众不同时,多少显得有点滑稽。我们和猩猩的差别其实只有1%。而且,从更大范围来看,我们人类的基因组并不是最大的,我们的基因数目也不是最多的;最大的基因组来自于日本一种植物;这个表格中,平常不起眼的玉米,大概有5万个左右的基因,多于人类的2万个基因。中国人和美国人的基因相差只有0.1%,而我和你.%的基因都是一样的,差别不大。但是,回过头来要记住,因为它的基数是3.2×^9,你去乘基数之后,也就得到了^4到^5之间的差异。
我们经常会听到,不管是肿瘤也好,糖尿病也好,心脑血管疾病也好,经常都可以找到基因突变跟某一个疾病有关联的。但是请大家一定注意,很多情况只是一种关联,关联不是因果。因果是说,我和我老婆的存在,导致了我女儿的出生;而关联不是因果关系,只是一个随带的关系。比如我女儿碰巧上了这家幼儿园,她上这个幼儿园是一个关联,而不是因果。就像前面提到的一样,基因突变很多时候是一个关联;它并不可怕。而且我刚刚说了,哪怕我们.%相似,只有万分之一的不同,但是基数足够大。每个人,比如我们从爸爸妈妈继承的基因突变,每一代大概是个,这是有据可循的,而且这个里面大部分来自于父亲的贡献,有的遗传学家就此认为,其实进化的动力来自于父亲,因为它显现了更多突变,更有可能给后代带来基因的多样性,更有可能使得后代与众不同。
正是因为基因组学的如此重要,在人类基因组计划之后,全世界范围的科学家并没有放弃追逐。当时的人类基因计划研究对象只有一个人,但是一个人太少了,每个人都不一样,因此便有了后来的千人基因组计划,我们检测一下黄钟人,再测一下黑色人种,白色人种,每一个人种,不管是中国人,还是日本人,虽然差别可以缩小到十万分之一,但是它的数目还是足够大的。
所以千人基因组计划出台后,我们今后在使用的时候,在序列比对的时候,可能不用再去比人类基因组计划中的HG(人类基因组计划的第版),而是比对我们自己的,比对我们中国人群的,比对我们中国南方人群里面某一个亚系的人群基因组,这样才更有可能找到:我突变了什么?我哪种疾病爆发的可能性更大?这就是千人基因组计划的初衷。
后来,为了把一直困扰人类的癌症解释清楚,世界范围内的两大组织,分别是加拿大领衔的国际癌症基因组联盟和美国人领衔的癌症基因组图谱,用基因组学方法去测序某一个类别的肿瘤。
比如说肾癌,他们选择了多名肾癌患者来测序它的基因组,分析哪些肾癌产生了突变,哪些突变跟愈后相关联,哪些药物针对哪些突变,然后对患者后续治疗做指导。
美国人领衔的计划(TCGA)在去年结束,加拿大领衔计划(ICGC)现在还没有结束。但是毫无疑问,不管是白种人,黑种人,还是我们黄种人,我们人类最主要的肿瘤基本上都测序结束了,这就导致大量数据的产生。
我们知道一个U盘大概有十个G,乘以倍是php完整登录源码个T,再乘以倍是个P。而我们研究所里面数据储存远远高于这个,因为数据无时无刻不在产生,这样的数据量意味着我们需要更大容量,需要更大的容器来把它装下来,不然我们没有办法去比对它,没有办法很好地使用它。而这也导致了所谓的生物大数据的出现,大到了T级,大到了P级。
在大数据的应用方面,精准医学的出现毫无疑问对大数据是最好的回馈。因为花了那么多的钱,十几个国家的科学家投入研究,十几年的时间,数百亿美金的投入,对我们人类产生了如此多的数据,我们不用它岂不变成了垃圾?其实精准医学并不仅仅是美国总统在年和年曾经提到,在这之前,在我们中国,在我们中国科学院,在美国以外的地方,很早就有人提出来精准医学,因为需要针对每个人的基因背景,针对每个人蛋白背景来做个性化的裁减,来做个性化的治疗,这就是所谓的精准医疗,形象点来说,就是哪里坏了修哪里,这是最好的想法。
这是精准医学在癌症领域的应用。我展示的这个流程图是以肝癌为例的整个精准医疗的流程。术前影像显示有个肿块,影像结果出来之后,大部分患者会选择做手术。手术之后我们会进行一个病理学的判断,诊断肝癌到哪一级,哪一期;并且对这样的手术样本进行基因组学建库,建库以后进行基因组学测序,测序之后进行分析,分析以后会由董事会(咨询委员会)坐下来讨论这个患者的基因背景是什么样的,哪些突变可能是致病的,哪些不是主要的突变,董事会(咨询委员会)里面会包含至少四类人员,包括生物信息学家、遗传学家、临床大夫、病理医生。讨论结束后,我们针对这些可用的突变频谱进行验证,验证结束之后我们会对患者进行报告。比如肝癌,已有的病理学分析到了哪个层面,现在基因组分析到了哪个状态,现在有哪些药可以用,哪些是针对患者的。这样的报告就是精准医学最直接的体现。
在国外,精准医疗已经在顶尖医院应用了大概5年左右的时间,但是精准医疗并没有完全的铺开,我们中国才刚刚起步。但是中国人从来都是勤奋的,国外需要一个月完成的流程,在我们中国天就可以搞定。
讲一个故事,这个故事的主角是华盛顿大学的一个助理教授,他自己做白血病研究。不幸的是,年的时候,他自己得上了白血病。按照以往的方法进行了化疗,但是5年过后病情复发,他移植了弟弟的骨髓,可是好景不长,三年之后他再次复发,而这个时候癌症基因组学的进展处在一个高峰阶段,癌症基因组学发现他有一个基因异常高表达,而且靶向药物可以治疗这个异常高表达基因。这里有一点特别强调的是,这个靶向药物其实是治疗晚期肾癌的。换句话说,他用治疗肾癌的药物治疗了白血病,那么现状如何呢?最近的资料显示他还活着。这是一个幸运儿,从开始治疗到现在已经过去了十二三年的时间,对于白血病患者来说,这是一个奇迹,对于肿瘤基因组学应用来说也是一个非常令人振奋的消息。
另一个例子与糖尿病有关。这位长者是斯坦福大学的教授,他自己也是做遗传学研究的,他的故事于年发表在Cell期刊--这是我们生物学研究人员最梦寐以求发文章的地方,可以理解为顶级期刊。他的故事讲到,在多天的时间里,他分个时段采集自己的血液做基因组的分析,他发现自己存在二型糖尿病的风险,这个风险值大概0.5左右,这个时候他就有点着急了,就像之前我们在网络上看到过的那样,安吉丽娜·朱莉因为家族罹患乳腺癌和卵巢癌的织梦更换源码风险过大,就把乳腺全部切除了。当这位教授知道自身血糖升高之后,就开始进行行为干预,此后血糖降了下来。对于他来说精准医学是一个成功案例,因为它成功的延缓了自己糖尿病的进展,很有可能让自己的糖尿病发生时间延后,甚至不发生。
这是两个经典例子:一个是癌症,一个是糖尿病。这么好的例子,我们大部分人支付的起吗?答案是肯定的。年的时候,每个人做基因组测序的花费是亿美金,到了今天变成了一万元人民币,时间成本和人力成本直线式下降,年变成天,人力成本从三千人变成了三到五个人就能够搞定。所以现在一万块钱就可以测一个人的基因组,在今年年底这个费用还会继续下降,业界最终目标是一千块钱测一个人的基因组。也许5年左右的时间,我们可以用手机APP查看自己的基因组,享受生物大数据、基因组学数据、精准医疗带给大家的普惠,当然,在一定程度上,先期时候还是需要付费的。
正是因为生物数据的如此复杂多样,它的层次除了DNA,RNA,还有蛋白质,还有更多层面,这么多的数据,作为一个大夫来讲不可能完全记得的。对于我们绝大部分民众来说也没有必要记这个事情,因为有人替我们去做。
以IBM为代表的商业机构推出了所谓的电脑医生平台,这个平台最大的特点就是在秒之内搜索百万级别的文献,并给出一个相对合理的治疗方案。其中诊断阶段,治疗阶段,每个方案都有参考文献,不是凭空而来的,够强大吧?可能有人会担心,最后我们去医院看病可能医生不见了,可能被电脑替代了。事实上我可以很明确的告诉大家,不论今后怎么变,大夫必不可少,因为电脑所做的事情虽然如此强大,能够在秒内给出答案,但是这个答案仍基于已有的数据库,它没有推断的能力。
当然,如果说基于AlphaGO能够击败李世石这件事情,可以认为人工智能存在无限可能,但是至少从目前来看,电脑医生只是一个供人们搜索和检索的数据库,而不是一个具有推动、推算、推演能力、有逻辑思维能力的真正的人。所以大家想象的,到医院去对着一台机器说话,然后他告诉我去哪里检查,然后给我抽血、做按摩、做手术,这还需要很长的时间,但不能说绝对没有可能。
既然精准医疗是如此好的东西,为什么没有广泛推广?除了之前提到的费用原因,就我们国内状况来看,还有以下几个方面是需要进一步打破壁垒。
因为精准医疗是新事物,所以在监管层面还有很多东西没有理顺,没有一个真正条文规定告诉该怎么做,这是第一个方面。
第二个方面,对于患者来说,或者是对患者家属来说,他们非常想参与进来,但他们不知道有什么途径可以了解相关的信息。比如我把测序仪买回来,测序结果出来以后,医院也不会分析;如果我们依靠第三方机构,问题又来了,第三方机构鱼龙混杂,难以取信;甚至我们经常可以在街边巷尾看到这样的兜售行为,说给你家孩子测个基因,看看他未来适合做科学家、艺术家,还是适合当教师。这些到现在为止,因为我们的数据库不够强大,市面都是一些虚假的广告。
第四个层面,是目前还没有一家第三方机构能够把我前面提到的四种认证专家集中起来做这件事情,因为这个行业还处于起步阶段,网易钓鱼源码下载还有很多需要完善的地方,但是曙光已经出现,今后的可能性很大。
我们人类从有史以来,死亡原因一直在变迁,多年前我们绝大部分的祖先都是因为饥饿和战乱而死亡,到了上个世纪上半叶,感染性疾病,西班牙流感,给人类留下巨大创伤,我们今天读教科书的时候仍然心有余悸;到了上个世纪下半叶,心脑血管疾病,癌症成为死亡的主要原因,有一些科学家医学预测,当我们解决这些问题之后,在即将到来的未来,神经系统疾病将成为我们人类即将消亡的原因。基因组学能够解决所有问题吗?答案是否定的。因为我们每个人的基因只有一套,但是基因上面所修饰的,所依附的,所被黏附在上面的分子是多种多样的。
时至今日,生命的天书已经被打开了,我们期待它给我们带来不一样的应用,最终造福于我们人类的健康,为我们人类谋更大的福祉,谢谢大家。谢谢中科院青促会对我个人成长的资助!
出品:中国科普博览SELF格致论道
登陆“SELF格致论道”官方网站获取更多信息(/)。本期视频也将陆续在中国科普博览上推出,敬请关注。更多合作与SELF工作组self@cnic.cn联系。
水无常形——开源围棋 AI 软件 KataGo 安装使用指南
KataGo是一款由David J. Wu开发的围棋软件,它借鉴了DeepMind的AlphaGo Zero与AlphaZero论文中的研究,并在训练速度上进行了大幅改进,成为目前世界顶级的电脑围棋软件之一。其名字来源于日语“かた”,寓意通过强化学习永久训练自己并完成形式的人工智能。 KataGo相比AlphaGo的优势在于使用方法。用户通过命令行输入指令,KataGo以文本形式输出分析结果。对于非专业用户来说,掌握这些指令较为困难。因此,需要一个图形用户界面作为中介,将用户的棋谱转化为命令,将KataGo的输出转化为可视化的棋盘。常见的图形用户界面包括KaTrain等工具。 此外,KataGo提供了四个后端版本供用户选择,分别是OpenCL、CUDA、TensorRT和Eigen。根据不同的硬件配置和需求,用户可以选择最适合的后端版本以优化性能。 在安装KataGo之前,需要确保显卡驱动程序已经安装。对于TensorRT后端,还需要额外安装CUDA和TensorRT。以下是KataGo的安装步骤:前往KataGo的源代码库编译或下载主程序。
下载权重文件,并将其复制到KataGo文件夹中。
使用命令行自动生成配置文件,根据提示设置规则和参数。
对于那些希望简化安装过程的用户,可以尝试使用KaTrain这样的All in One工具。KaTrain提供了一个集成的界面,使得使用KataGo变得更加容易。 如果您希望深入了解KataGo的高级使用方法,可以按照以下步骤进行:在KataGo文件夹中使用命令生成配置文件。
自动生成配置文件时,根据提示设置规则和参数。
对于自定义配置文件的编辑,您可以按照特定的规则和参数进行修改,以适应您的需求。例如,您可以在规则部分选择特定的规则,调整是否允许认输,以及设置线程数以优化性能。 最后,为了提供更直观的分析结果,您可以使用图形用户界面工具,如Sabaki,与KataGo配合使用。通过设置界面参数,您可以查看胜率图、变化树等信息,以便更好地理解AI的分析结果。 总之,KataGo是一款强大的围棋软件,通过适当的选择后端版本、安装配置文件和使用图形用户界面工具,您可以在不同的硬件环境中优化其性能,从而获得更深入的围棋分析体验。柯洁被打败,中美人工智能的战争才刚刚开始吗?
柯洁输了!5月日,国内知名围棋选手柯洁,与阿尔法狗的第一场大战落下帷幕,双方交锋至第手棋,执黑的柯洁以约四分之一子的微弱劣势,败给围棋人工智能程序AlphaGo。
虽然阿尔法狗击败了围棋选手,但是却并没有击败国内的人工智能公司,《纽约时报》此前撰文指出中美人工智能正在进入全新的军备竞赛阶段,中国的技术也正在逐渐赶上;除此之外《麻省理工评论》首次将中国的百度、阿里的人工智能技术列为十大突破性技术;而《财富》杂志也将百度,与微软、谷歌、脸书并列为人工智能四大巨头讨论。
中国的人工智能发展正受到同行认可,中美的人工智能战争也才刚刚开始。
除了阿尔法狗概念类产品,人工智能成败的关键,在于这智能终端、操作系统、开源开放、商业化落地这四个方面。我们不妨来看一下,中美各家在这几个方面的布局。
智能终端占领之战
当前的智能依然停留在请求智能阶段,无论是电脑还是手机,用户都需要主动向智能机器发出请求才能够实现功能,而未来的智能在尼葛洛庞帝看来,是一场感知智能的革命,不用发送任何请求,用户的需求就可以被智能感知,智能家居、智能电子屏、可穿戴、无人车、无人机等等智能硬件将等同于未来。
这种预言并非空穴来风,据IDC统计,年智能终端数量将达.3亿,智能终端的机会将不亚于手机。
作为第一步,亚马逊在智能家居中已处于领先位置,其发布的智能音箱,自年至今出货约万台,占据了美国%的市场,布局最进击的谷歌,此前斥亿美元收购nest布局智能家居,并在今年的开发者大会上发布了自己的智能音箱谷歌home,同时向第三方开发者开放,再次向该领域发起进攻。
而国内,智能硬件的布局也已经起步,雷军以小米生态链模式孵化了家相关企业,其物联网平台已拥有超万的连接设备,APP也拥有万日活用户。
其次,最为进击的是百度,陆奇上任之后大刀阔斧进入该领域,收购了国内最大的智能硬件服务商“涂鸦科技”,并将度秘升级为事业部,而度秘则拥有与谷歌home同样的语音对话能力,并且已经展开各种第三方合作。
人工智能的操作系统之战
智能硬件只是人工智能战争一部分,占领硬件的最终目的是为了覆盖自身的人工智能系统,将语音识别、语音唤醒、图像识别、自然语言理解、及其翻译等等技术整合到一处,实现最强的整合输出。
从PC到智能机,操作系统从windows变成了IOS与安卓,每一次的技术变革都会带来操作系统的全新机会。国外目前巨头各自都有先发优势,微软有windows、苹果有IOS,谷歌有安卓,三巨头先发优势不再赘述。
而国内,唯独BAT拥有人工智能OS级别的布局能力。
百度的度秘已推出dueros,并且与小鱼在家,中信国安广视,vivo等等达成了合作,并且度秘依托于百度的生态体系,其又将各种语音识别、图像识别、自然语言理解的能力覆盖至百度各个产品线中,用户可以使用dueros实现各种智能服务。
阿里将OS押注在阿里云上,推出yunos系统,不断去融合旗下投资的手机企业魅族、锤子以及第三方智能硬件。
腾讯推出过手机OS,但几乎折戟,微信推出的小程序,成立独立搜索部门,也意成为一个微信OS系统,并整合各种智能能力。目前来看微信依然是产品驱动,而不是智能驱动,微信要想在智能时代续命,还需更硬的人工智能技术协同,以及大量硬件接入。
开源开放之战
未来的智能硬件市场巨大,不可能全归巨头所有,各大传统家电企业汽车企业以及创业者等也必然参与其中,如果能够让更多传统企业,及智能硬件开发者接入自身全部或者部分OS系统,则更能够巩固自身地位,占领更多智能场景。
这点上,国外巨头从特斯拉到微软谷歌,都已经对大量的项目进行代码开源以及平台能力的开放,特斯拉更是直接开放了智能驾驶的专利技术。
而目前国内,百度与阿里做的更好一些。
百度在无人车战略上采取了“阿波罗计划”,直接开放无人车源码以及能力,而这一次百度也先于谷歌,此外百度也向全球开放了各种深度学习的代码,以及深度学习、图像识别、语音识别等等智能能力,更偏重于前沿技术的开放。
其次是阿里,阿里云的优势在服务器底层,因此开放的技术内容主要偏重于底层布局,主要集中于大数据挖掘与处理。
商业变现之战
发展人工智能,最终还是为了拉动商业价值,在这点上国内外做法都一致。因此Deepmind的阿尔法狗虽然打败了人类围棋选手,但现在也在尝试进军医疗领域,希望能找到盈利的商业场景。
一方面巨头在通过人工智能提原有的升商业效率,一方面又在利用人工智能创造全新的场景。
在第一层诉求上,各巨头都在将人工智能技术运用到自身各产品的变现能力。
但在拓展场景方面,整体又都处在摸索阶段,尤其对于小公司来说更是困难重重,例如搜狗、出门问问、科大讯飞这些公司,虽然也有自身技术,但在变现场景上没有爆发性业务,像是科大讯飞表面上做语音智能,但变现主业务还是教育软件业务。
值得一说的是谷歌与百度,都采取了一攻一守的姿势。
谷歌采用Alphabet架构,将盈利性业务与探索性的业务进行分离,进而能更好的探索新兴市找到商业场景,而去年百度也做出了组织架构调整,同样是为了人工智能的攻防战。
拥有全球营收能力的谷歌,可以花费更多的时间消耗在探索新技术以及收购各个公司上,并期待下一个安卓的出现。而百度却处于一个竞争压力更大的中国,增速的放缓,让其不得不寻找能够触底反弹的业务,迅速落地更多的落地人工智能场景。
幸运的是百度也找到了一些当前就可以实现盈利的业务,例如信息流分发业务,其依托于百度搜索,以及产品体系,正在带来全新的收入增长,另外百度也落地了AR实验室,将这种前沿技术更快的反哺给商业场景,近期火热的“AR兵马俑”、“朝阳门复兴”、“欧莱雅项目”、“肯德基点餐”等诸多营销案例,也给百度未来的商业空间留下诸多可能性。
结语:
人工智能的中美竞赛,是一场从该技术实力比拼,到商业化能力比拼的多维战争,中国科技公司第一次能够真正与国际同行竞争,并且受到国际认可。
从综合实力来看,国内的BAT拥有最强与国外巨头的对峙能力,其中百度的人工智能布局最为全面最具技术优势,而国外则是谷歌。
而百度也是被谷歌写入财报的唯一中国对手公司。
因此百度与谷歌的AI对抗,也是目前阶段中美人工智能对抗的最关键标志。
腾讯T2I-adapter源码分析(1)-运行源码跑训练
稳定扩散、midjourney等AI绘图技术,为人们带来了令人惊叹的效果,不禁让人感叹技术发展的日新月异。然而,AI绘图的可控性一直不是很好,通过prompt描述词来操控图像很难做到随心所欲。为了使AI绘制的图像更具可控性,Controlnet、T2I-adapter等技术应运而生。本系列文章将从T2I-adapter的源码出发,分析其实现方法。
本篇是第一篇,主要介绍源码的运行方法,后续两篇将以深度图为例,分别分析推理部分和训练部分的代码。分析T2I-Adapter,也是为了继续研究我一直在研究的课题:“AI生成同一人物不同动作”,例如:罗培羽:stable-diffusion生成同一人物不同动作的尝试(多姿势图),Controlnet、T2I-adapter给了我一些灵感,后续将进行尝试。
T2I-Adapter论文地址如下,它与controlnet类似,都是在原模型增加一个旁路,然后对推理结果求和。
T2I-Adapter和controlnet有两个主要的不同点,从图中可见,其一是在unet的编码阶段增加参数,而controlnet主要是解码阶段;其二是controlnet复制unit的上半部结构,而T2I-Adapter使用不同的模型结构。由于采用较小的模型,因此T2I-Adapter的模型较小,默认下占用M左右,而controlnet模型一般要5G空间。
首先确保机器上装有3.6版本以上python,然后把代码clone下来。随后安装依赖项,打开requirements.txt,可以看到依赖项的内容。然后下载示例,下载的会放到examples目录下。接着下载sd模型到model目录下,再下载T2I-Adapter的模型到目录下,模型可以按需到huggingface.co/TencentA...下载。这里我下载了depth和openpose。sd模型除了上述的v1-5,也还下载了sd-v1-4.ckpt。
根据文档,尝试运行一个由深度图生成的例子,下图的左侧是深度图,提示语是"desk, best quality, extremely detailed",右侧是生成出来的。运行过程比较艰辛,一开始在一台8G显存的服务器上跑,显存不够;重新搭环境在一台G显存的服务器上跑,还是不够;最后用一台G显存的服务器,终于运行起来了。
接下来尝试跑openpose的例子,下图左侧是骨架图,提示词为"Iron man, high-quality, high-res",右侧是生成的图像。
既然能跑推理,那么尝试跑训练。为了后续修改代码运行,目标是准备一点点数据把训练代码跑起来,至于训练的效果不是当前关注的。程序中也有训练的脚步,我们以训练深度图条件为例,来运行train_depth.py。
显然,习惯了,会有一些问题没法直接运行,需要先做两步工作。准备训练数据,分析代码,定位到ldm/data/dataset_depth.py,反推它的数据集结构,然后准备对应数据。先创建文件datasets/laion_depth_meta_v1.txt,用于存放数据文件的地址,由于只是测试,我就只添加两行。然后准备,图中的.png和.png是结果图,.depth.png和.depth.png是深度图,.txt和.txt是对应的文本描述。
文本描述如下,都只是为了把代码跑起来而做的简单设置。设置环境变量,由于T2I-Adapter使用多卡训练,显然我也没这个环境,因此要让它在单机上跑。而代码中也会获取一些环境变量,因此做简单的设置。
做好准备工作,可以运行程序了,出于硬件条件限制,只能把batch size设置为1。在A显卡跑了约8小时,完成,按默认的配置,模型保存experiments/train_depth/models/model_ad_.pth。那么,使用训练出来的模型试试效果,能生成如下(此处只是为了跑起来代码,用训练集来测试),验证了可以跑起来。
运行起来,但这还不够,我们还得看看代码是怎么写法,下一篇见。
PS:《直观理解AI博弈原理》是笔者写的一篇长文,从五子棋、象棋、围棋的AI演进讲起,从深度遍历、MAX-MIN剪枝再到蒙特卡罗树搜索,一步步介绍AI博弈的原理,而后引出强化学习方法,通俗易懂地介绍AlphaGo围棋、星际争霸强化学习AI、王者荣耀AI的一些强化学习要点,值得推荐。
AUTOMATIC的webui是近期很流行的stable-diffusion应用,它集合stable-diffusion各项常用功能,还通过扩展的形式支持controlnet、lora等技术,我们也分析了它的源码实现,写了一系列文章。
机器人能治理国家吗?换言之,机器人能取代美国总统吗?
机器人家上了解到,前不久马云曾说过未来年后世界上最优秀的CEO可能是机器人。在未来数年,数以百万计的人类工作岗位将被机器人取代。工人、司机和飞行员可能最容易受到影响,而艺术家、演员以及经理人等需要与人类打交道的工作则会继续保持安全。有些工作可能必须由人类继续承担,但对于经理人来说,被取代的危险却越来越高。很快,机器人将取代人类担任高级管理职务,包括首席执行官(CEO)。而这一切将比我们想象的更早到来。
机器人的进化速度比想像更快
网络上有很多文章分析预测,哪些职业不会受到机器人或自动化影响。2年前,公认的安全职业为律师、医生以及金融分析师。然而令人惊讶的是,这些文章的预测已被证明显然是错误的,各种各样的人类工作都在受到自动化的快速侵蚀。
年,在美国国防部高级研究计划局(DARPA)举办的挑战赛上,最好的无人驾驶汽车也仅仅行驶了公里就陷入瘫痪。8年后,谷歌(微博)无人驾驶汽车却独自行驶了近万公里,期间没有发生过任何事故。
年前,全世界都敬畏地看着计算机“深蓝”击败国际象棋世界冠军加里·卡斯帕罗夫(Gary Kasparov)。令人惊奇的是,“深蓝”使用强力计算能力和预定义规则获得了胜利,而非真正的机器智能。与此同时,有人预测电脑可能还需要年时间才能在围棋游戏中击败人类棋手。
可是仅仅几天前,谷歌AlphaGo在五场比赛中击败世界围棋冠军李世石。令人感到震惊的不是计算机成了围棋世界冠军,而是AlphaGo实际上是自学成才的,可以模仿我们所谓的“直觉”。
机器人在无形中崛起
过去很长时间中,人类都以为地球是宇宙的中心。至少我们现在依然存在幻想,认为现代生活中的一切都以人类为中心。但现实是,我们的世界正被机器人优化。
大多数由人类书写的网络内容都需要通过机器的重新设计。你在网络上读到的任何文章都在被优化,谷歌算法通过抓取到足够关键词、相关连接以及短语,以便获得更高的“页面排名”得分。谷歌在网络搜索领域取得的成功证明,在决定何时、何地信息才会被最有效地展示时,机器人的表现更好。
在物理世界中,电脑也能比人类做出更好的决定,快餐连锁店已经开始实现自动化。尽管尚没有烙牛肉饼的机器人,但已经有软件帮助制定何人何时工作计划。
员工们可能不喜欢它,但是计算机化的人事决策显然更高效。这是因为人类经理人在查看工作空间时存在限制,而机器人却能一次性监控数百人类产生的数据。更为重要的是,机器人拥有更好的优化能力,软件可以通过云技术轻易扩展到更多岗位。一旦新的调度方法展现出工厂生产力得到改善的效果,新的策略在数秒内就会被数以百计的岗位所复制,并立即实施,不再需要昂贵的培训,也不会有人抵制改变。
令人感到讽刺的是,我们已经达到一个临界点,相比起机器人同事来说,有些人更憎恶人类同事。下次你与自动电话系统对话,并说脏话时,你可能被立即转接回人类操作员,因为他们更擅长处理粗鲁客户。
机器人CEO表现更好
在提到CEO时,你可能想到报酬丰厚的老板坐在巨大玻璃办公室中的红木桌后面,盯着外面成千上万的工人。但现实完全不同,年美国人口普查局公布数据显示,.%的美国企业只有不到名员工。小公司进行董事会投票,用机器人取代工人通过的风险更小,小企业CEO将看到自己的职责和决定被大数据和预测性分析“优化”,无论他们是否喜欢。
企业书籍和管理顾问通常列举CEO的6个代表性功能:决定战略方向、分配资源、建立文化、监督和提高公司业绩、代表公司形象以及巧妙应对日常妥协等。对于大多数CEO来说,做出客观的、数字驱动的决策更有利于企业成功。
想像一下,一家小建筑公司的老板想要购买卡车。昨天,这个决策完全是他自己下的。今天,对公司数据的实时分析显示他需要支付多少贷款利息。明天,分析将确定建筑工地的位置以及员工的行程,它甚至监控当地经济趋势。不久后,电脑告诉老板:“我很遗憾,鲍勃,我认为你不该购买卡车。”计算机首先帮助人类变得更高效,然后让人类显得多余。
在分配资源工作方面,计算机也做得更好。计算机不仅可以同时考虑到更多参数,同时其输出是中性且可不断重复的。这令其决策更难受到质疑。对于那些害怕承担法律风险的企业主来说,算法管理是最终解决方案:歧视诉讼最终只需审核软件源代码。软件还可为非技术性企业主带来优化好处。承包商无需掌握熟练的线性规划能力,就可以选择哪个项目更合适。
计算机不仅比人类更聪明,它们也可以考虑到人类忽略的因素,进而做出更好的决策。举例来说,Waze可以向你显示最好的路径,即使在日常通勤中,因为它知道几公里外是否出现交通拥堵。
投资者和股东最终可能推动算法管理成为主流。不仅因为这种管理方式更高效,而且可预防徇私舞弊、挪用贪污等行为。办公室政治很快将变得无关紧要,机器人可以确保其决策总是与董事会的战略相一致。随着数据驱动的决策从资源分配到绩效衡量,最终到日常管理任务,人类高管的决策主要转向“为什么”,而非“如何”。
有些创新公司甚至已经没有中心领导层,就连企业文化都由明确的规则和激励机制代替,而不再基于CEO的个人理念。Valve Software没有经理人或老板,简短的员工手册奠定了企业文化,比如“任何人无需向其他人报告”,“我们有创始人/总裁,但他不是经理人。”
瑞典咨询公司Crisp大约有人组成,但他们都不是真正的“员工”,也没有经理人或CEO。决策通常由集体做出,而非依赖某些经理人去分配任务。当有新任务出现时,Crisp会开发自己的协议详细确定责任链。
留给人类CEO的任务将是传递公司福音。换句话说,CEO将成为最重要的讲故事者。公司将向国家那样,所有决策遵循“国会”的协定,国家总统则成了新闻秘书。
工作区分散将加速转型
大型集中化的办公室和生产设施需要经理人的仔细规划,这种情况在过去年间发生了巨大变化。物理集中变得不再重要,大公司和办公室正被独立承包商的Ad-Hoc(点对点)模式网络所取代。
随着软件公司的重要性日益增加,企业影响与其规模不再息息相关。被Facebook斥资亿美元收购的WhatsApp如今已经是世界上最大通信应用,而被收购时它刚创建5年时间,仅有名员工。AirBnB如今是世界上最大的酒店公司,但其却没有任何酒店房间甚至清洁员工。机器人经理特别适合这类新型企业,因为它们可以立即适应和发展这些企业。
准备好应对机器人老板吗?
如今,每天都有数以亿计的人遵循着软件设定的程序或指令工作。我们可能不会称这些指令为“命令”,但大数据和分析驱动公司上层决策的时代即将来临。一个机器人已经开始锻炼“直接管理控制”能力,包括对万名工人进行绩效评估,它就是打车应用Uber的自动化管理系统。
糟糕的消息是,与现任老板比起来,你的下个老板可能更缺少同情心。好消息是,它将不再有任何针对你个人的无理举动。