(科技日报记者 陈曦,通讯员 赵晖、郭道鹏)老师讲的案例需要巨大的算力,计算机跑不动怎么办?AI模型需要大量的数据,传输慢怎么破?下载的软件相互不兼容,实验推不动怎么办?……AI时代教学科研出现了很多AI新烦恼,面对这些新的烦恼,天津大学着手建设AI云平台对课堂进行智能改造,为教育科研装上了数字大脑。
依照国家建设新一代人工智能的总体部署而成立的天津大学智能与计算学部,集结了天大在认知计算、数据科学、智能技术与应用等高精尖专业领域的优势资源。该学部将人工智能引入日常教学中,通过集中建设CPU、GPU资源池,为学部下属的计算机学院、软件学院、网络安全学院、人工智能学院提供统一的算力平台——天津大学人工智能科研云平台。该平台集成了高性能计算集群、GPU集群、虚拟化集群和云平台。在高速万兆光纤网络互联下,高性能计算集群可支持批处理模式的科研计算,GPU集群支持AI推理、演算的科研计算,云平台的虚拟机用于前期的程序调试,以及小规模实验教学,完整覆盖项目所需的所有计算需求。
“在我的唇读研究中,有500多G的数据,以往在实验室因为内存限制,要忍痛删掉很多,分批次上传。使用AI平台的大文件上传,没有带宽和存储的限制,500G数据2个小时左右就能一次上传成功。”
“实验室虽然有不少高性能GPU卡,但需要用的同学更多,训练模型格外的慢,一次实验跑完也得一周左右,使用AI平台训练就快多了,相同的迭代次数只需要1-2天就能完成。这对模型调优帮助太大了。“
“以前想要查看模型的中间结果,需要把图片从服务器复制到本地才能查看,在AI平台可以实时查看模型的结果。”
对这个AI云平台同学们给予了“五星”评价。
“对于高年级以及天天泡实验室的研究生同学们而言,实验环境与科研项目的推进息息相关。自行下载的开源软件往往面临着插件依赖、系统不兼容等问题,在天津大学智能与计算学部的人工智能科研云平台中,已经包含了深度学习训练推理、大数据挖掘、科学计算基础软件环境以及能够支持GPU的任务调度系统,可以为同学们提供与业界接轨的实验环境。此外,丰富的资源类型也能满足来自不同院系、不同学校的学生,无论是直接在框架上做训练,还是深入底层架构,都能一一满足。”智算学部教授王建荣介绍说。
在人工智能科研云的加持下,天津大学智能与计算学部不仅能顺利展开国家科技重大专项、国家自然基金以及省部级以上的各类项目,还进一步推进产学研转化,促进校企结合的前沿科学研究和工程项目顺利进行。
据了解,该平台不仅全面支撑起智算学部内人工智能、大数据处理分析、高性能计算等相关的教学实验和科学研究,还通过专业的运营实现云基础设施资源的扩容,为其他院系提供支撑。
科技日报:http://www.stdaily.com/index/kejixinwen/2020-09/24/content_1022157.shtml
转载自天津大学新闻网