大嘴哥最近看到光明日报的新闻报道,说“广州天河”系列产品将升级,升级后的系统软件是原来广州天河系统软件功能的200多倍。
200次,这是一个轰动的大数字。然后,很自然的,我也把这个问题认证给了采访特邀嘉宾。特邀嘉宾对文章内容的理解是不正确的,但毫无疑问,已经研制出了新的更快的高性能计算机,其总体目标是超越制造业新的高峰期——100亿元。
虽然100亿的总目标目前来看还是比较长的,虽然现阶段大家还只能朝着这个总目标的“雏形”前进,但是未来的某一天,比如今年或者某个时间点,100亿最终还是会到来的。但是,要处理这样一个快速复杂的系统软件,除了“耗能墙”和“用墙”的困难,我们还面临着如何用好系统软件的问题。
“有木有”和“如何”是一个难题的两个阶段。现在根据广州天河和神威系列产品的高性能计算机,大家已经解决了“有木有”的问题。广州、中科院、长沙、无锡的几个超算中心的机器设备都是制造业领先的服务平台。但在“如何”的问题上,无论是全国各地的各个科研单位还是高等院校,可能都没有拍着胸脯保证。
但如果称之为“好”,就要有一个考量的标准。就像大家提到的几个超算中心,很多人都有超算的工作经验,但是设备效果如何,不同的人有不同的看法。甚至对于很多人来说,如果你会用跑步,你就已经赢了。
超级计算机应用第一步:先清除程序
“每个人都在谈论高通量测序和蛋白质拉伸,但当你从事电子计算机时,真的很难弄清楚这些代码和应用命令。”在我采访的高校老师中,很多人都有类似的感受。自然知道他们的专业技能,但是把这种专业技能转化成计算机可以识别的语言,显然超出了他们的业务范围。更重要的是,他们除了投身于技术类专业的科研之外,还要抽出大量的时间来学习和训练编程语言。
这显然不切实际,但也是无奈之举。在我认识的老师中,很多都是自学了软件编程的相关专业知识,也有老师是凭借软件工程在同行业的应用从事新的项目。但是,无论如何,这都是一项费力的工作,而且坦率地说,这些内容对技术类专业的科研和应用并没有太大的帮助。新项目升级的内容能否交给技术专业人员来完成,这样程序升级会更快更准。相信是很多老师关注的难题。
超级计算机应用第二步:再次运行程序
经过一番努力,很多老师已经将专业技术人员的原始问题转化为编程语言和实体模型,可以在超算服务平台上运行。只是在运行的情况下,他们发现无论是广州超算还是无锡超算或者其他服务平台,要达到最佳的运行效率,都需要对原有的程序进行有目的的升级。
其中,不同的服务平台会选择不同的加速机器和设备,有的是intelXeonPhiCPU,有的是NVIDIAGPU,甚至神威太湖之光和无锡超算一样,也使用自主研发的神威服务平台。因此,对不同的机器设备进行改进,不仅是方案的要求,也是教师的难点。当程序真正完成并行处理,让所有CPU键都能高负荷运行,这才是它需要的样子。
然而,说起来容易做起来难。那么对于大部分不懂电子计算机的老师来说,几行程序代码怎么改进呢?
超级计算应用第三步:网络维护很重要
前不久我提到一位老师,他科学地研究了蛋白质的膨胀和收缩。他遇到的不仅是程序应用和实体模型构建的困难,还有数据传输的困难。事实上,对于每一门课程来说,必须由高性能计算机分析和求解的实体模型的应用都是不容易和繁重的,这也意味着如果按照互联网上传到超级计算中心,将需要很长的时间。几天或几周,都有可能。
甚至,类似的大气物理、地质勘探等数据信息,都是以TB级规范来考虑的。因此,数据的传输不仅需要老师花费很长的时间,而且从超级计算中心读取数据也必须通过从网上免费下载来申请。这一次又一次,它将比测量本身花费更多的时间。所以很多老师都期望根据遥控数据,将实际 *** 作可视化,即时得到结果的反馈,方便调整测量实体模型。否则,空需要时间。不用说,背后有大量的电脑和昂贵的费用。
那么,有没有可能按照遥控数据的可视化方法来减少等待时间呢?对于超大容量的数据信息,有没有更高效、方便、快捷的传输技术?
超级计算应用的第四步:数据库管理怎么办
数据库管理可以说是超级计算机应用的终极目标,也是最重要的过程。在此之前,经过程序的完善,实体模型的建立,数据信息上传到超算中心进行开发运行,得到即时反馈的结果。但是如何管理这个结果,如果是新项目,可以说;但是,绝大多数教师都有几个程序要重新运行。如何检查每个程序的运行情况,如何在程序运行错误时立即得到报警和反馈,都是老师们特别关注的问题。
其实在IT运维行业,自动化运维的定义已经流行很久了,有很多解决方案可以遵循。但是,对于超算中心来说,由于服务平台的唯一性和应用的目的性,单靠客户是无法合理控制所有程序的,在信息不正确的情况下也无法第一时间报警。毕竟老师有很多工作要做,盯着显示屏监控系统不太实际。所以,这个时候,智能系统的系统软件就显得非常重要了。
值得一提的是,在一段时间后,当一个老师想要了解自己的申请状态,或者一个新项目完成后,必须出示匹配的数据分析报告,这些事情都应该由系统软件自动完成。在人力资源的帮助下,这仍然是一项非常漫长和复杂的工作。
如果超算中心也能展示一键生成报告的功能就好了。你这样认为吗?
这是大多数人眼中的超级计算的难点。自然有很多专家可以在里面处理一个或者几个流程,但是要进行这种从模型到提交,从计算到报告的实际 *** 作,并不容易。换句话说,让技术专业的人做技术专业的事。一个叫并行科技的公司发布了一个叫“超级计算云服务器”的业务流程管理系统,解决了很多老师的要求。
不懂编程语言,不懂建模?——没事。并行科技拥有技术专业人员,可为技术专业人员提供724小时人性化服务,包括但不限于程序编译器的应用、安装应用的具体说明、云计算服务器的有效调度和应用、软件环境配置等。如果你自然选择了高级服务项,那么你会继续得到更详细的内容如查看和 *** 作应用资源分配、工作中的常见问题、定制脚本文件等。
云计算服务器不能升级吗?——没问题。并行科技与广州、中科院、长沙、无锡等多个超算机构合作,展示了包括英特尔至强Fat连接点、GPU网络加速、MIC集群等多种云计算服务器,能够完成不同资源间的资源共享等一系列应用。自然,成为VIP客户,还可以获得黑盒测试和黑盒推广、测量服务平台定制开发设计等高级定制服务项目。,可以从根使用。
上网传输速度慢怎么办?——没事。并行技术已经在北京和广州之间架设了并行处理专线传输互联网,完善了客户和超级计算机之间的互联网路由协议,适用于电信网、联通、教育信息网等运营商。客户可以随时随地自动配对或手动选择路由协议,以最小的延迟找到最合适的路由协议。至于数据传输的问题,并行技术可以根据远程控制数据的可视化技术,解决超算中的数据信息,并以本地模式显示信息,从而大大提高工作效率。
如果你的数据信息真的太多,水货科技还有一个叫“40TB大空移动机柜”的高科技。简单来说,就是基于“闪电侠”的高效率,由驻场技术工程师帮助你将数据信息从本地安全地运送到超算中心,然后完成8小时送达和24小时送达。好像AWS以前就是这样传输海量信息的,据说实际效果还不错!
多客户海量信息管理方法,如何完成自动化技术——说起数据库管理,这也算是并行技术的老本行了。并行科技多年前发布的Paramon服务平台,是面向超算管理专业手机软件。本次升级到cloud空后,可以多种方式应用到桌面和手机上,可以完成一键方便快捷的作业提交、工作运行状态实时查询、应用功能和账单诊断。
没错,说到省钱的问题,你无疑会问:就算并行技术已经展现出超算云这样好的服务项目,可以完成超算从模型到报告的一站式服务,那么收费标准一定很贵。其实大嘴一开始的想法和你一样。但我在并行技术方面了解到的情况是,现阶段超算云服务器的资费标准和超算中心以及各种云服务平台是一样的。换句话说,不管你是独立购买超算中心的超算,还是按照并行处理超算云服务器购买,你花的钱都是一样的,一样的,一样的。
那么你会问,在成本都一样的情况下,并行技术怎么赚钱?这个问题有点难回答。然而,如果你想想各大补贴的app,你能说不方便是时髦的互联网营销吗?
今天宋丹丹出的“把小象放进冰箱分两步走”的题,结果令人瞠目结舌。许多人期望的是,答案是如此简单和直接。如今看似复杂的超级计算问题,在并行技术的超级计算云之前,早已迎刃而解。如果你是客户,在同样的成本预算下,你是选择老的劳苦方式,还是轻装上阵,一步一个脚印的使用云服务器?
超申请有两个步骤,你心里要有数。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)