在省政府下达的七项目标任务中:全市城镇化率目标任务为提高13个百分点,目前城镇化率已达到30%,比去年提高13个百分点;城市生活垃圾无害化处理目标任务为市区处理率100%。目前已经铺开了吕梁市区和孝义市两个垃圾无害化处理厂建设项目。其中,吕梁市区垃圾处理厂总投资额3900万元。目前已完成投资2180万元,预计春节前可投入使用,完成目标任务。孝义垃圾无害化处理厂已立项并完成了工程可研;城市绿化覆盖率目标任务为绿化覆盖率提高15个百分点。目前建成区新增绿化面积7220万m2,三山绿化新增绿化面积2307万m2,城市绿化覆盖率提高了15个百分点;污水处理目标任务为污水处理率达到60%。目前我市市区和两个县级市都上马了污水处理厂建设工程。其中吕梁市区污水处理厂总投资5890万元,目前已完成投资2600万元,全部投产后可达标;集中供热目标任务为供热普及率达到51%。目前,吕梁市区及市辖县、市共新增集中供热面积158万平方米。吕梁市区新增集中供热面积30万平方米,完成投资3000多万元,中吕焦化厂200万平方米热电联产项目完成后可达标;城镇居民人均住宅建筑面积增长目标任务为城镇居民人均住宅面积达到20平方米。目前全市城镇房屋建设面积188万平方米,建设投资达162亿元,已竣工面积37万平方米,正在建设的城镇房屋面积151万平方米。城镇居民人均住宅面积达20平方米;农村居民人均住宅建筑面积增长目标任务为农村人均住宅面积达到2892平方米。目前全市农村新建住宅11070万平方米,总投资498亿元。农村人均住宅面积达到29平方米。
今年,省政府“十二件实事”中涉及我市建设系统的两项。一是建设安康居住工程住房500万平方米,解决6万户困难居民的住房。二是改造工矿企业棚户区,新开工建设住宅面积95万平方米,让16万户、45万人住上新房;启动治理矿山沉陷区,开工新建住宅面积206万平方米,让34万户、12万人住上新房,维修加固房屋面积125万平方米,让2万户、7万人住进安全的房子。目前,安康居住工程开工面积为455万平方米,已完成投资53668万元。其中,普通商品房开工27万平方米,已完成投资34080万元,可建成成套住宅2395套。经济适用住房开工185万平方米,已完成投资19588万元,可建成成套住宅2245套。廉租住房已落实85(套)户,落实廉租住房资金78万元,还有廉租住房15(套)户、廉租住房资金22万元正在落实中;改造工矿企业棚户区我市涉及汾西矿业集团有限责任公司在孝义的水峪矿、柳湾矿、交城县的大兴矿,据初步统计全市棚户区改造共3900户,面积312万平方米。孝义市在城南新区规划了255亩土地,用于棚户区改造建设,土地手续正在办理报批中。交城县拿出了102亩棚户区改造的选址方案,具体事项正在协商中;启动治理矿山沉陷区工作正在调查研究之中。
市政府“十件实事”涉及建设部门一项,即市区供热普及率达到51 %,目前中吕焦化厂200万平方米热电联产项目正在实施中,项目建成后可完成目标任务。
1、华胜天成
华胜天成的业务方向涉及云计算、大数据、移动互联网、物联网、信息安全等领域,业务领域涵盖IT产品化服务、应用软件开发、系统集成及增值分销等多种IT服务业务,是中国最早提出IT服务产品化的公司。
2、必创科技
无线传感器网络是物联网产业发展的基础和核心,受到国家政策的大力支持。公司是国内最早从事无线传感器网络相关产品研发、生产的企业之一。
3、凤凰光学
2016年12月9日,凤凰光学披露最新收购预案,拟以2215元/股发行3255万股,作价721亿元,购买海康科技100%股权。
海康科技的主营业务为智能控制器、物联网产品、智能设备的研发、生产和销售,其中智能控制器业务收入占比最高,物联网业务是海康科技的重点发展方向。交易后,凤凰光学将新增加海康科技的智能控制器、物联网、智能设备等业务。
4、汇顶科技
汇顶科技正式宣布进军NB-IoT(Narrow Band Internet of Things,窄带物联网)领域,通过并购全球领先的半导体蜂窝IP提供商——德国CommSolid。
整合其全球的超低功耗移动无线基带技术优势与汇顶科技位于美国加州的射频芯片设计及相关技术研发力量,加速公司在NB-IoT领域的战略布局,为全球客户提供差异化的蜂窝物联网系统级芯片(System-on-Chips)解决方案,合力开拓千亿规模NB-IoT市场。
5、力源信息
公司拟以每股1144元的价格定增1239万股,以142亿元收购鼎芯无限35%股权,交易完成后,公司将持有鼎芯无限100%股权。交易对方承诺鼎芯无限2015年至2017年净利分别不低于3750万元、4500万元、5400万元。鼎芯无限是一家专注于物联网综合解决方案的IC产品技术型分销商。
参考资料来源:百度百科—华胜天成
参考资料来源:百度百科—北京必创科技有限公司
参考资料来源:百度百科—凤凰光学
参考资料来源:百度百科—深圳市汇顶科技股份有限公司
参考资料来源:百度百科—武汉力源信息技术股份有限公司
中国互联网行业发展概况、未来六大发展趋势及未来发展形势预测 一、互联网行业发展现状 近十年中国互联网网民数量快速增长,网民数量十年复合增长率达到89%,超过这段 时间中国的GDP 平均增速;相较之下,美国网民数量缓慢增长,网民数量十年复合增长率为 26%,甚至在某些年份网民数量出现负增长。2018 上半年中国互联网网民数量增加 2968 其中手机网民数量增长3509万,可见现阶段中国网民数量增长主要来自于人口红利以及智 能手机的大范围普及。一旦人口红利枯竭,网民数量将主要由经济形势决定。随着网民数量 的增长,中国互联网网民渗透率也在逐年增加,由2009 289%提升至2018 585%,若参考美国768%的渗透率,中国互联网渗透率尚有183%可以提升。可以预见,未来中国 网民增长主要来自与三部分群体:新增人口、偏远地区人群以及老年群体。因此紧紧抓住这 部分群体需求的公司,业务规模将会持续增长。中国网民渗透率接近天花板,这也是众多互 联网巨头2018 年在ToB 领域重点布局的原因之一。 2009-2018 年中美互联网网民数量及渗透率对比 数据来源:公开资料整理 从2009 年至今,美国互联网网民在全世界网民中的占比持续下降;相较之下,中国互 联网网民在全世界网民中的占比虽然略有起伏,但总体上开启了下降的阶段。可见未来全球 互联网网民的增长来源主要是非洲以及南美地区的第三世界国家。在这一大背景下,作为世 界经济体量最大的美国以及拥有全球最多互联网网民的中国未来(或现在)必然会把自己的 互联网技术、产品以及商业模式向这些国家和地区进行输出。因此产品和商业模式的本地化 处理将成为中美诸多公司探索的重点。与此同时,中国互联网用户规模快速发展的过程中, 用户教育的模式、挖掘用户潜力和价值的手段以及面对如此多用户的技术和管理经验为全球 互联网经济的发展提供了借鉴意义。 2009-2018 年中美网民数量占世界网民的比例 数据来源:公开资料整理 至今为止,随着互联网产业2C 的流量市场与商业机会接近天花板,同时伴随着AI、区 块链、大数据、云计算、5G 等技术的发展与突破,技术之间的相互取长补短实现了大数据 作为生产资料、算力作为生产力、区块链作为生产关系的科技矩阵。多元科技融合将优先服 端的产业矛盾存在多年,技术改造需求强烈;另一方面,C 端的服务所需要的高并发性能、低价硬件成本等条件目前技术无法满足。 互联网产业的渗透与发展 数据来源:公开资料整理 得益于大数据、云计算、区块链、智能终端以及网络通信等技术的进步,为制造业或工 业、金融、医疗、交通、零售、城市建设与管理、政府及事业单位等各行各业提供了突破信 息互联网服务局限的新型科技产业形态。在过去人们所经历的信息互联网产业变革中,存在 信息服务边界,因此,诸如教育、医疗、制造业等对打破信息不对称需求不强烈的行业,并 没有受到较大的影响。物联网其实是互联网的一个延伸,互联网的终端是计算机(PC、服务器),我们运行的所有程序,都是计算机和网络中的数据处理和数据传输,除了计算机外,没有涉及任何其他的终端(硬件)。
物联网的本质还是互联网,只不过终端不再是计算机(PC、服务器),而是嵌入式计算机系统及其配套的传感器。这是计算机科技发展的必然结果,为人类服务的计算机呈现出各种形态,如穿戴设备、环境监控设备、虚拟现实设备等等。只要有硬件或产品连上网,发生数据交互,就叫物联网。
物联网就业机会非常多,因为物联网技术应用非常广泛,例如:
1、智能家居;智能家居是利用先进的计算机技术,物联网技术,通讯技术,将与家具生活的各种子系统有机的结合起来,通过统筹管理,让家具生活更舒适,方便,有效,与安全。
2、智能交通
3、智能医疗
4、智能电网;智能电网是在传统电网的基础上构建起来的集传感、通信、计算、决策与控制为一体的综合数物复合系统,通过获取电网各层节点资源和设备的运行状态,进行分层次的控制管理和电力调配,实现能量流、信息流和业务流的高度一体化,提高电力系统运行稳定性,以达到最大限度地提高设备效利用率,提高安全可靠性,节能减排,提高用户供电质量,提高可再生能源的利用效率。
5、智能物流
扩展资料
物联网是新一代信息技术的重要组成部分,也是"信息化"时代的重要发展阶段。其英文名称是:"Internet of things(IoT)"。顾名思义,物联网就是物物相连的互联网。这有两层意思:其一,物联网的核心和基础仍然是互联网,是在互联网基础上的延伸和扩展的网络;其二,其用户端延伸和扩展到了任何物品与物品之间,进行信息交换和通信,也就是物物相息。
物联网通过智能感知、识别技术与普适计算等通信感知技术,广泛应用于网络的融合中,也因此被称为继计算机、互联网之后世界信息产业发展的第三次浪潮。物联网是互联网的应用拓展,与其说物联网是网络,不如说物联网是业务和应用。因此,应用创新是物联网发展的核心,以用户体验为核心的创新20是物联网发展的灵魂。
活点定义:利用局部网络或互联网等通信技术把传感器、控制器、机器、人员和物等通过新的方式联在一起,形成人与物、物与物相联,实现信息化、远程管理控制和智能化的网络。物联网是互联网的延伸,它包括互联网及互联网上所有的资源,兼容互联网所有的应用,但物联网中所有的元素(所有的设备、资源及通信等)都是个性化和私有化。
(1)芯片提供商:物联网的大脑;(2)传感器供应商:塑造物联网的五官;
(3)无线模组厂商:实现联网和定位的关键
(4)网络运营商:掌控物联网的通道;
(5)平台服务商:完善物联网的有效管理;
(6)系统及软件开发商:打造物联网的动脉;
(7)智能硬件厂商:提供物联网的终端承载;
(8)系统集成及应用服务提供商:物联网应用落地的实施者;
行业主要上市公司:网达软件(603189)、快手(01024)、中兴通讯(000063)、卫士通(002268)、东方国信(300166)、荣联科技(002642)、浪潮信息(000977)、卫宁健康(300253)、东华软件(002065)、万达信息(300168)、东软集团(600718)、创业慧康(300451)、思创医惠(300078)、麦迪科技(603990)、和仁科技(300550)、易联众(300096)、久远银海(002777)等。
本文核心数据:产业园数量、公司营收、生产企业数量等。
互联网产业链全景梳理:应用主体面向全社会
互联网产业诞生之初就被应用于不同场景以改善原有产业形态,前瞻认为我国互联网产业链上游主要为互联网产业支撑类设施建设,包括但不限于互联网产业发展硬件设施建设和互联网产业应用软件系统研发,产业中游则主要为互联网产业在不同应用场景下呈现的产业形态。在“万物互联”的产业发展下改变着人们生活的方方面面,因此互联网产业下游主要为面向社会各界的应用主体。除此,在复杂的国内外互联网环境下,互联网产业安全贯穿始终,监管机构则出台相关举措,对产业进行全产业链监管。
互联网产业上游支撑类设施建设主要包括软硬件支撑等,代表企业有三大电信运营商、麒麟软件、浪潮等;互联网产业中游按应用场景来看,代表企业主要有西门子、阿里巴巴、字节跳动、卫宁健康、科大讯飞、京东数科和数梦工程等;互联网产业下游则是面向整个社会的应用主体部分。
互联网产业链区域热力地图:福建省分布最多
互联网产业具有较强的产业交叉发展特征,根据国家统计局《国民经济产业分类》(2019年修订版全文)标准,互联网产业与批发和零售产业、信息技术产业、租赁和商务服务业以及文娱业均有关联,根据此产业分类,在企查猫中以“互联网”为关键词,检索我国互联网企业。
数据显示,截止2021年11月1日,我国互联网注册企业(存续和在业企业,下同)规模达到658万家,其中福建和广东地区互联网产业公司分布数量最多。
注:截止2021年11月1日。
中国互联网协会自2013年以来已连续8年开展中国互联网企业综合实力研究,获得了业界、政府部门以及各级媒体的广泛关注和认可。互联网企业综合实力研究工作不仅展示了我国互联网企业风采,还体现了我国互联网行业发展的新变化、新趋势,为推进网络强国建设,引导互联网行业良性发展提供客观的参考,为互联网企业在前进的道路上提供新模式、新业态等方面的借鉴。
从我国互联网产业前100名企业名单来看,北京市是各大互联网企业聚集地,其互联网企业数量高达38家,其次为上海市,企业数量为18家。
互联网产业园分布图:广东省最多
目前我国互联网产业园共有342个,其中广东省信创产业园分布数量最多,达到52个,其次为安徽省和浙江省,其产业园数量同为29个。其中产业园区分布前十大省份中产业园区分布主要城市有深圳、广州、合肥、杭州、南京、青岛、重庆、西安、福州、南昌和吕梁等地。
注:截止2021年10月。
互联网代表性企业相关营收情况:阿里巴巴和腾讯合计营收超万亿
根据中国互联网协会每年对于互联网产业企业名单的统计,前瞻选择了其中11家具有代表性的互联网企业进行详细分析。这些企业中阿里巴巴和腾讯为中国互联网产业的两大巨头,其企业布局近乎涵盖了互联网各个领域。其余互联网公司在互联网产业领域则主要集中于互联网产业中的某一细分领域,成为其细分产业领域先进企业。
互联网代表性企业最新投资动向:多元化发展成未来趋势
从各大互联网公司布局来看,原本专注于某一企业的互联网公司开始谋求多元化发展,因此未来在互联网产业领域,多元化全产业链发展或将成为发展趋势。
以上数据参考前瞻产业研究院《中国互联网行业市场前瞻与投资战略规划分析报告》。
2010年10月18日《国务院关于加快培育和发展战略性新兴产业的决定》在这一决定中,物联网作为新一代信息技术里面的重要一项被列为其中,成为国家首批加快培育的七个战略性新兴产业。这标志着物联网被列入国家发展战略,对中国物联网的发展具有里程碑的重要意义。
2011年3月16日《国家"十二五"规划纲要》
《刚要》提出要推动重点领域跨越发展,大力发展节能环保、新一代信息技术、新能源、新材料等战略性新兴产业。物联网是新一代信息技术的高度集成和综合运用,已被国务院作为战略性新兴产业上升为国家发展战略。
2011年4月6日《物联网发展专项资金管理暂行办法》(财政部)
根据办法,专项资金是由中央财政预算安排,用于支持物联网研发、应用和服务等方面的专项资金。专项资金的使用应当突出支持企业自主创新,体现以企业为主体、市场为导向、产学研用相结合的技术创新战略,鼓励和支持企业以产业联盟组织形式开展物联网研发及应用活动。专项资金由财政部、工业和信息化部各司其职,各负其责,共同管理。
2011年5月9日《工业和信息化部2011年标准化重点工作》(工信部)
文件提出将围绕"十二五"规划纲要和产业发展重点,加强标准战略研究,加快物联网、新能源汽车等重要领域标准制定和修订,为保持工业通信业平稳较快发展做好支撑。对于一些产业急需标准,今年将进一步加大标准制定力度。今年将围绕技术改造、自主创新、节能减排、淘汰落后、质量品牌、两化深度融合、培育发展战略性新兴产业等重点工作,组织制定标准3000项,发挥标准的引导和规范作用,满足产业发展的需求。
2012年2月14日:《"十二五"物联网发展规划》(工信部)
规划提出,到2015年,中国要在物联网核心技术研发与产业化、关键标准研究与制定、产业链条建立与完善、重大应用示范与推广等方面取得显著成效,初步形成创新驱动、应用牵引、协同发展、安全可控的物联网发展格局。
2012年8月17日:《无锡国家传感网创新示范区发展规划纲要(2012―2020年)》(工信部)
根据此《纲要》,中国将加大对示范区内物联网产业的财政支持力度,加强税收政策扶持;同时,推进物联网企业通过资本市场直接融资。到2015年,无锡示范区拥有一批具有自主知识产权的物联网核心技术,形成具有国际竞争力的产业集群,基本形成结构合理的物联网产业体系,实现一批重点领域的典型示范与推广应用,构建一支高素质人才队伍,促进物联网标准化工作。到2020年,无锡示范区的创新能力、产业规模、从业人员数量和影响力大幅提升,实现一大批自主创新成果产业化,成为具有一流创新能力的技术创新核心区;集聚和培育一批国内领先的物联网企业,成为具有国际竞争力的产业发展集聚区;建成一批具有重大推广价值的典型应用示范工程,成为具有较强影响力的应用示范先导区。
2013年2月5日:《国务院关于推进物联网有序健康发展的指导意见》(国务院办公厅)
《意见》提出,到2015年,我国要实现物联网在经济社会重要领域的规模示范应用,突破一批核心技术,培育一批创新型中小企业,打造较完善的物联网产业链,初步形成满足物联网规模应用和产业化需求的标准体系,并建立健全物联网安全测评、风险评估、安全防范、应急处置等机制。意见指出,将建立健全有利于物联网应用推广、创新激励、有序竞争的政策体系,抓紧推动制定完善信息安全与隐私保护等方面的法律法规。建立鼓励多元资本公平进入的市场准入机制。加快物联网相关标准、检测、认证等公共服务平台建设,完善支撑服务体系。加强知识产权保护,加快推进物联网相关专利布局,从而推动物联网健康有序的发展。
2013年3月4日:《国家重大科技基础设施建设中长期规划(2012-2030年)》(国务院办公厅)
《国家重大科技基础设施建设中长期规划》指出三网融合、云计算和物联网发展对现有互联网提出了巨大挑战,基于TCP/IP协议的互联网依靠增加带宽和渐进式改进已经无法满足未来发展的需求。建设未来网络试验设施,主要包括:原创性网络设备系统,资源监控管理系统,涵盖云计算服务、物联网应用、空间信息网络仿真、网络信息安全、高性能集成电路验证以及量子通信网络等开放式网络试验系统。该设施建成后,网络覆盖规模超过10个城市。
2013年9月17日:《物联网发展专项行动计划(2013-2015)》(国家发展改革委、工业和信息化部、科技部、教育部、国家标准委)
计划包含了顶层设计、标准制定、技术研发、应用推广、产业支撑、商业模式、安全保障、政府扶持、法律法规、人才培养10个专项行动计划。各个专项计划从各自角度,对2015年物联网行业将要达到的总体目标作出了规定。
2013年10月31日:发改委近日下发通知,要求各地组织开展2014-2016年国家物联网重大应用示范工程区域试点。
通知指出,支持各地结合经济社会发展实际需求,在工业、农业、节能环保、商贸流通、交通能源、公共安全、社会事业、城市管理、安全生产等领域,组织实施一批示范效果突出、产业带动性强、区域特色明显、推广潜力大的物联网重大应用示范工程区域试点项目,推动物联网产业有序健康发展。
2014年6月中旬:《工业和信息化部2014年物联网工作要点》(工信部)
通知指出,2014年,物联网工作重点为:1、加强顶层设计和统筹协调:加强物联网工作统筹协调,加强对地方和行业物联网发展的指导。2、突破核心关键技术:推进传感器及芯片技术、传输、信息处理技术研发,推进传感器及芯片技术、传输、信息处理技术研发,开展物联网技术典型应用与验证示范,构建科学合理的标准体系。3、开展重点领域应用示范:构建科学合理的标准体系,开展农业、商贸流通、节能环保、安全生产等重域和交通、能源、水利等重要基础设施领域应用示范,推进公共安全、医疗卫生、城市管理、民生服务领域应用示范,依托无锡国家传感网创新示范区开展应用示范,推动电信运营等企业开展物联网应用服务。4、促进产业协调发展:培育和挟持物联网骨干企业,引导和促进中小企业发展,引导和促进中小企业发展,培育物联网产业聚集区,建设和完善公共服务平台,组织商业模式研究创新和推广。5、推进安全保障体系建设:建立健全物联网安全保障体系,建立健全物联网安全保障体系。6、营造良好发展环境:加强各部门工作衔接,加强各部门工作衔接,完善产业发展政策,加大财税和金融支持力度,加快完善法律法规,加强专业人才培养。
2014年7月:《关于印发10个物联网发展专项行动计划的通知》(发改高技〔2013〕1718号)要求
国家发展改革委、工业和信息化部、科技部、教育部、国家标准委联合物联网发展部际联席会议相关成员单位制定了10个物联网发展专项行动计划,请根据各行动计划的指导思想、总体目标、重点任务、分工与进度、保障措施等,尽快细化本地区的具体措施,加强沟通协调,务实推进相关工作。
1 大数据兴起预示“信息时代”进入新阶段
(1) 看待大数据要有历史性的眼光
信息时代是相对于农业和工业时代而言的一段相当长的时间。不同时代的生产要素和社会发展驱动力有明显差别。信息时代的标志性技术发明是数字计算机、集成电路、光纤通信和互联网(万维网)。尽管媒体上大量出现“大数据时代”的说法,但大数据、云计算等新技术目前还没有出现与上述划时代的技术发明可媲美的技术突破,难以构成一个超越信息时代的新时代。信息时代可以分成若干阶段,大数据等新技术的应用标志着信息社会将进入一个新阶段。
考察分析100年以上的历史长河可以发现,信息时代与工业时代的发展规律有许多相似之处。电气化时代与信息时代生产率的提高过程惊人地相似。都是经过20~30年扩散储备之后才有明显提高,分界线分别是1915年和1995年。笔者猜想,信息技术经过几十年的扩散储备后,21世纪的前30年可能是信息技术提高生产率的黄金时期。
(2) 从“信息时代新阶段”的高度认识“大数据”
中国已开始进入信息时代,但许多人的思想还停留在工业时代。经济和科技工作中出现的许多问题,其根源是对时代的认识不到位。18-19世纪中国落后挨打,根源是满清政府没有认识到时代变了,我们不能重犯历史性的错误。
中央提出中国进入经济“新常态”以后,媒体上有很多讨论,但多数是为经济增速降低做解释,很少有从时代改变的角度论述“新常态”的文章。笔者认为,经济新常态意味着中国进入了以信息化带动新型工业化、城镇化和农业现代化的新阶段,是经济和社会管理的跃迁,不是权宜之计,更不是倒退。
大数据、移动互联网、社交网络、云计算、物联网等新一代信息技术构成的IT架构“第三平台”是信息社会进入新阶段的标志,对整个经济的转型有引领和带动作用。媒体上经常出现的互联网、创客、“第二次机器革命”、“工业40”等都与大数据和云计算有关。大数据和云计算是新常态下提高生产率的新杠杆,所谓创新驱动发展就是主要依靠信息技术促进生产率的提高。
(3)大数据可能是中国信息产业从跟踪走向引领的突破口
中国的大数据企业已经有相当好的基础。全球十大互联网服务企业中国占有4席(阿里巴巴、腾讯、百度和京东),其他6个Top10 互联网服务企业全部是美国企业,欧洲和日本没有互联网企业进入Top10。这说明中国企业在基于大数据的互联网服务业务上已处于世界前列。在发展大数据技术上,我国有可能改变过去30年技术受制于人的局面,在大数据应用上中国有可能在全世界起到引领作用。
但是,企业的规模走在世界前列并不表示我国在大数据技术上领先。实际上,国际上目前流行的大数据主流技术没有一项是我国开创的。开源社区和众包是发展大数据技术和产业的重要途径,但我们对开源社区的贡献很小,在全球近万名社区核心志愿者中,我国可能不到200名。我们要吸取过去基础研究为企业提供核心技术不够的教训,加强大数据基础研究和前瞻技术研究,努力攻克大数据核心和关键技术。
2 理解大数据需要上升到文化和认识论的高度
(1) 数据文化是一种先进文化
数据文化的本质是尊重客观世界的实事求是精神,数据就是事实。重视数据就是强调用事实说话、按理性思维的科学精神。中国人的传统习惯是定性思维而不是定量思维。目前许多城市在开展政府数据开放共享工作,但是发现多数老百姓对政府要开放的数据并不感兴趣。要让大数据走上健康的发展轨道,首先要大力弘扬数据文化。本文讲的数据文化不只是大数据用于文艺、出版等文化产业,而是指全民的数据意识。全社会应认识到:信息化的核心是数据,只有政府和大众都关注数据时,才能真正理解信息化的实质;数据是一种新的生产要素,大数据的利用可以改变资本和土地等传统要素在经济中的权重。
有人将“上帝与数据共舞”归纳为美国文化的特点之一,说的是美国人既有对神的诚意,又有通过数据求真的理性。美国从镀金时代到进步主义时期完成了数据文化的思维转变,南北战争之后人口普查的方法被应用到很多领域,形成了数据预测分析的思维方式。近百年来美国和西方各国的现代化与数据文化的传播渗透有密切关系,我国要实现现代化也必须强调数据文化。
提高数据意识的关键是要理解大数据的战略意义。数据是与物质、能源一样重要的战略资源,数据的采集和分析涉及每一个行业,是带有全局性和战略性的技术。从硬技术到软技术的转变是当今全球性的技术发展趋势,而从数据中发现价值的技术正是最有活力的软技术,数据技术与数据产业的落后将使我们像错过工业革命机会一样延误一个时代。
(2)理解大数据需要有正确的认识论
历史上科学研究是从逻辑演绎开始的,欧几里得几何的所有定理可从几条公理推导出来。从伽利略和牛顿开始,科学研究更加重视自然观察和实验观察,在观察基础上通过归纳方法提炼出科学理论,“科学始于观察”成为科学研究和认识论的主流。经验论和唯理论这两大流派都对科学的发展做出过重大贡献,但也暴露出明显的问题,甚至走入极端。理性主义走向极端就成为康德所批判的独断主义,经验主义走入极端就变成怀疑论和不可知论。
20世纪30年代,德国哲学家波普尔提出了被后人称为“证伪主义”的认识论观点,他认为科学理论不能用归纳法证实,只能被试验发现的反例“证伪”,因而他否定科学始于观察,提出“科学始于问题”的著名观点[3]。证伪主义有其局限性,如果严格遵守证伪法则,万有引力定律、原子论等重要理论都可能被早期的所谓反例扼杀。但“科学始于问题”的观点对当前大数据技术的发展有指导意义。
大数据的兴起引发了新的科学研究模式:“科学始于数据”。从认识论的角度看,大数据分析方法与“科学始于观察”的经验论较为接近,但我们要牢记历史的教训,避免滑入否定理论作用的经验主义泥坑。在强调“相关性”的时候不要怀疑“因果性”的存在;在宣称大数据的客观性、中立性的时候,不要忘了不管数据的规模如何,大数据总会受制于自身的局限性和人的偏见。不要相信这样的预言:“采用大数据挖掘,你不需要对数据提出任何问题,数据就会自动产生知识”。面对像大海一样的巨量数据,从事数据挖掘的科技人员最大的困惑是,我们想捞的“针”是什么?这海里究竟有没有“针”?也就是说,我们需要知道要解决的问题是什么。从这个意义上讲,“科学始于数据”与“科学始于问题”应有机地结合起来。
对“原因”的追求是科学发展的永恒动力。但是,原因是追求不完的,人类在有限的时间内不可能找到“终极真理”。在科学的探索途中,人们往往用“这是客观规律”解释世界,并不立即追问为什么有这样的客观规律。也就是说,传统科学并非只追寻因果性,也可以用客观规律作为结论。大数据研究的结果多半是一些新的知识或新的模型,这些知识和模型也可以用来预测未来,可以认为是一类局部性的客观规律。科学史上通过小数据模型发现一般性规律的例子不少,比如开普勒归纳的天体运动规律等;而大数据模型多半是发现一些特殊性的规律。物理学中的定律一般具有必然性,但大数据模型不一定具有必然性,也不一定具有可演绎性。大数据研究的对象往往是人的心理和社会,在知识阶梯上位于较高层,其自然边界是模糊的,但有更多的实践特征。大数据研究者更重视知行合一,相信实践论。大数据认识论有许多与传统认识论不同的特点,我们不能因其特点不同就否定大数据方法的科学性。大数据研究挑战了传统认识论对因果性的偏爱,用数据规律补充了单一的因果规律,实现了唯理论和经验论的数据化统一,一种全新的大数据认识论正在形成。
3 正确认识大数据的价值和效益
(1)大数据的价值主要体现为它的驱动效应
人们总是期望从大数据中挖掘出意想不到的“大价值”。实际上大数据的价值主要体现在它的驱动效应,即带动有关的科研和产业发展,提高各行各业通过数据分析解决困难问题和增值的能力。大数据对经济的贡献并不完全反映在大数据公司的直接收入上,应考虑对其他行业效率和质量提高的贡献。大数据是典型的通用技术,理解通用技术要采用“蜜蜂模型”:蜜蜂的效益主要不是自己酿的蜂蜜,而是蜜蜂传粉对农业的贡献。
电子计算机的创始人之一冯·诺依曼曾指出:“在每一门科学中,当通过研究那些与终极目标相比颇为朴实的问题,发展出一些可以不断加以推广的方法时,这门学科就得到了巨大的进展。”我们不必天天期盼奇迹出现,多做一些“颇为朴实”的事情,实际的进步就在扎扎实实的努力之中。媒体喜欢宣传一些令人惊奇的大数据成功案例,对这些案例我们应保持清醒的头脑。据Intel中国研究院首席工程师吴甘沙在一次报告中透露,所谓“啤酒加尿布”的数据挖掘经典案例,其实是Teradata公司一位经理编出来的“故事”,历史上并没有发生过[4]。即使有这个案例,也不说明大数据分析本身有什么神奇,大数据中看起来毫不相关的两件事同时或相继出现的现象比比皆是,关键是人的分析推理找出为什么两件事物同时或相继出现,找对了理由才是新知识或新发现的规律,相关性本身并没有多大价值。
有一个家喻户晓的寓言可以从一个角度说明大数据的价值:一位老农民临终前告诉他的3个儿子,他在他家的地中埋藏了一罐金子,但没有讲埋在哪里。
他的儿子们把他家所有的地都深挖了一遍,没有挖到金子,但由于深挖了土地,从此庄稼收成特别好。数据收集、分析的能力提高了,即使没有发现什么普适的规律或令人完全想不到的新知识,大数据的价值也已逐步体现。
(2)大数据的力量来自“大成智慧”
每一种数据来源都有一定的局限性和片面性,只有融合、集成各方面的原始数据,才能反映事物的全貌。事物的本质和规律隐藏在各种原始数据的相互关联之中。不同的数据可能描述同一实体,但角度不同。对同一个问题,不同的数据能提供互补信息,可对问题有更深入的理解。因此在大数据分析中,汇集尽量多种来源的数据是关键。
数据科学是数学(统计、代数、拓扑等)、计算机科学、基础科学和各种应用科学融合的科学,类似钱学森先生提出的“大成智慧学”[5]。钱老指出:“必集大成,才能得智慧”。大数据能不能出智慧,关键在于对多种数据源的集成和融合。IEEE计算机学会最近发布了2014年的计算机技术发展趋势预测报告,重点强调“无缝智慧(seamless intelligence)”。发展大数据的目标就是要获得协同融合的“无缝智慧”。单靠一种数据源,即使数据规模很大,也可能出现“瞎子摸象”一样的片面性。数据的开放共享不是锦上添花的工作,而是决定大数据成败的必要前提。
大数据研究和应用要改变过去各部门和各学科相互分割、独立发展的传统思路,重点不是支持单项技术和单个方法的发展,而是强调不同部门、不同学科的协作。数据科学不是垂直的“烟囱”,而是像环境、能源科学一样的横向集成科学。
(3)大数据远景灿烂,但近期不能期望太高
交流电问世时主要用作照明,根本想象不到今天无处不在的应用。大数据技术也一样,将来一定会产生许多现在想不到的应用。我们不必担心大数据的未来,但近期要非常务实地工作。人们往往对近期的发展估计过高,而对长期的发展估计不足。Gartner公司预测,大数据技术要在5~10年后才会成为较普遍采用的主流技术,对发展大数据技术要有足够的耐心。
大数据与其他信息技术一样,在一段时间内遵循指数发展规律。指数发展的特点是,从一段历史时期衡量(至少30年),前期发展比较慢,经过相当长时间(可能需要20年以上)的积累,会出现一个拐点,过了拐点以后,就会出现爆炸式的增长。但任何技术都不会永远保持“指数性”增长,一般而言,高技术发展遵循Gartner公司描述的技术成熟度曲线(hype cycle),最后可能进入良性发展的稳定状态或者走向消亡。
需要采用大数据技术来解决的问题往往都是十分复杂的问题,比如社会计算、生命科学、脑科学等,这些问题绝不是几代人的努力就可以解决的。宇宙经过百亿年的演化,才出现生物和人类,其复杂和巧妙堪称绝伦,不要指望在我们这一代人手中就能彻底揭开其奥妙。展望数百万年甚至更长远的未来,大数据技术只是科学技术发展长河中的一朵浪花,对10~20年大数据研究可能取得的科学成就不能抱有不切实际的幻想。
4 从复杂性的角度看大数据研究和应用面临的挑战
大数据技术和人类探索复杂性的努力有密切关系。20世纪70年代,新三论(耗散结构论、协同论、突变论)的兴起对几百年来贯穿科学技术研究的还原论发起了挑战。1984年盖尔曼等3位诺贝尔奖得主成立以研究复杂性为主的圣菲研究所,提出超越还原论的口号,在科技界掀起了一场复杂性科学运动。虽然雷声很大,但30年来并未取得预期的效果,其原因之一可能是当时还没有出现解决复杂性的技术。
集成电路、计算机与通信技术的发展大大增强了人类研究和处理复杂问题的能力。大数据技术将复杂性科学的新思想发扬光大,可能使复杂性科学得以落地。复杂性科学是大数据技术的科学基础,大数据方法可以看作复杂性科学的技术实现。大数据方法为还原论与整体论的辩证统一提供了技术实现途径。大数据研究要从复杂性研究中吸取营养,从事数据科学研究的学者不但要了解20世纪的“新三论”,可能还要学习与超循环、混沌、分形和元胞自动机等理论有关的知识,扩大自己的视野,加深对大数据机理的理解。
大数据技术还不成熟,面对海量、异构、动态变化的数据,传统的数据处理和分析技术难以应对,现有的数据处理系统实现大数据应用的效率较低,成本和能耗较大,而且难以扩展。这些挑战大多来自数据本身的复杂性、计算的复杂性和信息系统的复杂性。
(1)数据复杂性引起的挑战
图文检索、主题发现、语义分析、情感分析等数据分析工作十分困难,其原因是大数据涉及复杂的类型、复杂的结构和复杂的模式,数据本身具有很高的复杂性。目前,人们对大数据背后的物理意义缺乏理解,对数据之间的关联规律认识不足,对大数据的复杂性和计算复杂性的内在联系也缺乏深刻理解,领域知识的缺乏制约了人们对大数据模型的发现和高效计算方法的设计。形式化或定量化地描述大数据复杂性的本质特征及度量指标,需要深入研究数据复杂性的内在机理。人脑的复杂性主要体现在千万亿级的树突和轴突的链接,大数据的复杂性主要也体现在数据之间的相互关联。理解数据之间关联的奥秘可能是揭示微观到宏观“涌现”规律的突破口。大数据复杂性规律的研究有助于理解大数据复杂模式的本质特征和生成机理,从而简化大数据的表征,获取更好的知识抽象。为此,需要建立多模态关联关系下的数据分布理论和模型,理清数据复杂度和计算复杂度之间的内在联系,奠定大数据计算的理论基础。
(2) 计算复杂性引起的挑战
大数据计算不能像处理小样本数据集那样做全局数据的统计分析和迭代计算,在分析大数据时,需要重新审视和研究它的可计算性、计算复杂性和求解算法。大数据样本量巨大,内在关联密切而复杂,价值密度分布极不均衡,这些特征对建立大数据计算范式提出了挑战。对于PB级的数据,即使只有线性复杂性的计算也难以实现,而且,由于数据分布的稀疏性,可能做了许多无效计算。
传统的计算复杂度是指某个问题求解时需要的时间空间与问题规模的函数关系,所谓具有多项式复杂性的算法是指当问题的规模增大时,计算时间和空间的增长速度在可容忍的范围内。传统科学计算关注的重点是,针对给定规模的问题,如何“算得快”。而在大数据应用中,尤其是流式计算中,往往对数据处理和分析的时间、空间有明确限制,比如网络服务如果回应时间超过几秒甚至几毫秒,就会丢失许多用户。大数据应用本质上是在给定的时间、空间限制下,如何“算得多”。从“算得快”到“算得多”,考虑计算复杂性的思维逻辑有很大的转变。所谓“算得多”并不是计算的数据量越大越好,需要探索从足够多的数据,到刚刚好的数据,再到有价值的数据的按需约简方法。
基于大数据求解困难问题的一条思路是放弃通用解,针对特殊的限制条件求具体问题的解。人类的认知问题一般都是NP难问题,但只要数据充分多,在限制条件下可以找到十分满意的解,近几年自动驾驶汽车取得重大进展就是很好的案例。为了降低计算量,需要研究基于自举和采样的局部计算和近似方法,提出不依赖于全量数据的新型算法理论,研究适应大数据的非确定性算法等理论。
(3)系统复杂性引起的挑战
大数据对计算机系统的运行效率和能耗提出了苛刻要求,大数据处理系统的效能评价与优化问题具有挑战性,不但要求理清大数据的计算复杂性与系统效率、能耗间的关系,还要综合度量系统的吞吐率、并行处理能力、作业计算精度、作业单位能耗等多种效能因素。针对大数据的价值稀疏性和访问弱局部性的特点,需要研究大数据的分布式存储和处理架构。
大数据应用涉及几乎所有的领域,大数据的优势是能在长尾应用中发现稀疏而珍贵的价值,但一种优化的计算机系统结构很难适应各种不同的需求,碎片化的应用大大增加了信息系统的复杂性,像昆虫种类一样多(500多万种)的大数据和物联网应用如何形成手机一样的巨大市场,这就是所谓“昆虫纲悖论”[6]。为了化解计算机系统的复杂性,需要研究异构计算系统和可塑计算技术。
大数据应用中,计算机系统的负载发生了本质性变化,计算机系统结构需要革命性的重构。信息系统需要从数据围着处理器转改变为处理能力围着数据转,关注的重点不是数据加工,而是数据的搬运;系统结构设计的出发点要从重视单任务的完成时间转变到提高系统吞吐率和并行处理能力,并发执行的规模要提高到10亿级以上。构建以数据为中心的计算系统的基本思路是从根本上消除不必要的数据流动,必要的数据搬运也应由“大象搬木头”转变为“蚂蚁搬大米”。
5 发展大数据应避免的误区
(1) 不要一味追求“数据规模大”
大数据主要难点不是数据量大,而是数据类型多样、要求及时回应和原始数据真假难辨。现有数据库软件解决不了非结构化数据,要重视数据融合、数据格式的标准化和数据的互 *** 作。采集的数据往往质量不高是大数据的特点之一,但尽可能提高原始数据的质量仍然值得重视。脑科学研究的最大问题就是采集的数据可信度差,基于可信度很差的数据难以分析出有价值的结果。
一味追求数据规模大不仅会造成浪费,而且效果未必很好。多个来源的小数据的集成融合可能挖掘出单一来源大数据得不到的大价值。应多在数据的融合技术上下功夫,重视数据的开放与共享。所谓数据规模大与应用领域有密切关系,有些领域几个PB的数据未必算大,有些领域可能几十TB已经是很大的规模。
发展大数据不能无止境地追求“更大、更多、更快”,要走低成本、低能耗、惠及大众、公正法治的良性发展道路,要像现在治理环境污染一样,及早关注大数据可能带来的“污染”和侵犯隐私等各种弊端。
(2) 不要“技术驱动”,要“应用为先”
新的信息技术层出不穷,信息领域不断冒出新概念、新名词,估计继“大数据”以后,“认知计算”、“可穿戴设备”、“机器人”等新技术又会进入炒作高峰。我们习惯于跟随国外的热潮,往往不自觉地跟着技术潮流走,最容易走上“技术驱动”的道路。实际上发展信息技术的目的是为人服务,检验一切技术的唯一标准是应用。我国发展大数据产业一定要坚持“应用为先”的发展战略,坚持应用牵引的技术路线。技术有限,应用无限。各地发展云计算和大数据,一定要通过政策和各种措施调动应用部门和创新企业的积极性,通过跨界的组合创新开拓新的应用,从应用中找出路。
(3) 不能抛弃“小数据”方法
流行的“大数据”定义是:无法通过目前主流软件工具在合理时间内采集、存储、处理的数据集。这是用不能胜任的技术定义问题,可能导致认识的误区。按照这种定义,人们可能只会重视目前解决不了的问题,如同走路的人想踩着自己身前的影子。其实,目前各行各业碰到的数据处理多数还是“小数据”问题。我们应重视实际碰到的问题,不管是大数据还是小数据。
统计学家们花了200多年,总结出认知数据过程中的种种陷阱,这些陷阱不会随着数据量的增大而自动填平。大数据中有大量的小数据问题,大数据采集同样会犯小数据采集一样的统计偏差。Google公司的流感预测这两年失灵,就是由于搜索推荐等人为的干预造成统计误差。
大数据界流行一种看法:大数据不需要分析因果关系、不需要采样、不需要精确数据。这种观念不能绝对化,实际工作中要逻辑演绎和归纳相结合、白盒与黑盒研究相结合、大数据方法与小数据方法相结合。
(4) 要高度关注构建大数据平台的成本
目前全国各地都在建设大数据中心,吕梁山下都建立了容量达2 PB以上的数据处理中心,许多城市公安部门要求存储3个月以上的高清监控录像。这些系统的成本都非常高。数据挖掘的价值是用成本换来的,不能不计成本,盲目建设大数据系统。什么数据需要保存,要保存多少时间,应当根据可能的价值和所需的成本来决定。大数据系统技术还在研究之中,美国的E级超级计算机系统要求能耗降低1 000倍,计划到2024年才能研制出来,用现在的技术构建的巨型系统能耗极高。
我们不要攀比大数据系统的规模,而是要比实际应用效果,比完成同样的事消耗更少的资源和能量。先抓老百姓最需要的大数据应用,因地制宜发展大数据。发展大数据与实现信息化的策略一样:目标要远大、起步要精准、发展要快速。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)