目前主要使用的医药数据库分为两大类,一个是免费医药数据库,一个是商业综合类的医药数据库。医药数据库的本质是让用户能在短时间内在一个网站把想要的信息通过检索一览无余,因此,全面性、准确性、及时性是该类数据库的主要指标。
先说免费医药数据库,大大小小的比较多,但真正用户量大,达到一定使用频率的,我们在此推荐三个最全面的:
①:DrugBank数据库,它是加拿大阿尔伯塔大学(University of Alberta)研究人员将详细的药物数据和全面的药物目标信息结合起来,建立的真实可靠的生物信息学和化学信息学数据库。DrugBank包含50万种药物信息,其中包括2653种经批准的小分子药物、1417种经批准的生物技术(蛋白质/肽)药物、131种营养品和6451种实验药物。
②:pharnexcloud,他目前是开放程度高的中文界面医药数据库,包含了全球药品研发管线、审评审批进度、全球临床试验、中国临床试验、药品招投标、集采、一致性评价等大量整合信息。
③:ClinicalTrials,它是一个基于网络的资源,为患者、他们的家庭成员、医疗保健专业人员、研究人员和公众提供了方便地访问关于各种疾病和病症的公共和私人支持的临床研究的信息。该网站由 美国国立卫生研究院的国家医学图书馆(NLM) 维护(NIH),美国国家医学图书馆提供的资源,探索所有 50 个州和 221 个国家/地区的 422,494 项研究。注:所有资料及相关研究仅供参考,未取得相关政府机构评定。
免费数据库涉及数据层面的关联性相对单一、数据深度存在一定局限性,毕竟这类数据库没有像商业数据库那样花上足够多的人力成本及时间成本去清洗、整理、维护数据。
商业类医药数据库往往是高价值数据库的代表。商业类医药数据库特点是功能强大不仅能对学术类信息加以融合处理,还能分析药品全生命周期数据,竞品药品销售详细情况、竞品企业招投标、投融资、集中采购信息等;除此之外还能实时跟踪产品管线最新信息,做到实时调整战略方向,防止做无用功浪费企业资源。现在商业类数据库可以说是医药企业必备的数据库。笔者就国内药企主要使用的商业医药数据库(同时对比两个国外数据库)给大家一一列举。
药融云企业版Pharnexcloud
数据全面性:★★★★★
运营企业:药融云数字科技
上线时间:2020年
数据库数量:218个
产品组成:药物研发库群、上市药品库群、药品销售库群、市场信息库群、一致性评价库群、原料药库群、医疗器械库群、生产检验库群、合理用药库群、医药文献等十个版块构成。
数据来源:各国药品监管机构、试验研究、学术会议报告、文献期刊、异构资源、企业公告各国卫生机构、医学新闻杂志、网络资讯、专利、协会学会等。
数据特色:数据采集近80个主流国家,监控全球10万+医药数据信息源,数据放大模型算法涉及人口学、经济学、发病率、医疗资源分布等各类特征参数。
增值服务:①专人对接需求,团队解决问题。②沙龙、巡讲、峰会、项目交易、需求对接等活动支持,能加入他们药融圈生态链。
优点:全面覆盖医药领域全产业链各环节,数据总量大、数据来源、专业报告、数据算法、结果展示都做得非常好。
缺点:相比较于全球顶尖的cortellis、informa等,pharnexcloud的数据展示结果关联性还有明显的进步空间。
pharnexcloud医药数据库后来居上,进步很快,近年来逐步成为国内医药企业选择较多的医药数据库,因其产品功能的全面和数据全面性得到越来越多的认可,希望能保持这个进步速度。
药智
综合性推荐指数:★★★★☆
运营企业:重庆康洲数据
上线时间:2009年
产品组成:由研发、一致性、生产、上市、市场、用药、药化、中药材、器械等九个版块组成。
数据来源:地区机构、资讯、企业公告报道、医疗会议、公司年度报告、医疗卫生机构、医学杂志、专利、商标、技术实施文件、学术会议、技术报告、科技期刊等。
数据库数量:172个
检索方式、功能点、底层数据架构、界面展示:与insight、Pharnexcloud数据库大体一致。
优点:药物综合报告、审评、临床数据都做得相当不错。而且仅此一家推出了化妆品、食品数据库。
缺点:药品销售数据起步阶段暂不够成熟,全球数据相对量少。(药品销售数据对于药品的立项调研、竞品销售分析、销售战略目标制定都是重中之重)。创新药物收录数量有待提高。
医药魔方
综合推荐指数:★★★★☆
运营企业:北京华彬立成
上线时间:2013年
数据库数量:49个
产品组成:资本透视、全球新药、全球临床、基础数据、市场洞察这五个版块构成。
数据来源:实验室研究、内部会议、专业报道、专利、商标、技术实施文件、学术会议、技术报告、科技期刊、文献、教科书、地区机构、资讯、新闻资讯、公司年度报告等。
产品亮点:资本透视和创新药物版块做得非常不错,在该领域都属于行业佼佼者。
收费:单价在国内偏高
优点:投融资版块、可视化疾病图谱和靶点整合、审评、临床等数据做充分关联、新上线的NextMed板块有一定领先性、其投融资版块做得很好。
缺点:总体数据数量偏少,药物研发也只解读了3万多个药物,比较同类产品丢失部分功能版块,全球数据不够丰富。销售数据模块虽然有,但十分封闭,无任何宣传,对其具体情况业内不了解。
医药魔方作为创新药物和医药投融资数据库目前国内用户沉积多的数据库之一,但其产品功能过于封闭,已成自己的围墙。
药渡
综合推荐指数:★★★☆
运营企业:药渡经纬信息科技
上线时间:2013年
数据库数量:132个
产品组成:由全球药物、全球器械、投资生态、临床研究、专利文献、政策法规、世界药问、数据定制八个版块构成。
数据来源:实验室研究、内部会议、专业报道、专利、商标、技术实施文件、学术会议、技术报告、科技期刊、在线数据库、在线辞典、电子书库、地区机构、资讯、企业公告报道、医疗会议等。
优点:其药物研发信息与国内审评、临床等多个库均有不错的关联,层级结构、标签及界面都做得相当不错。对生物药、化学药等细微标签做了单独优化。
缺点:目前没有药品销售数据,临床、上市药品分析等数据采集方面比较弱,总体数据量在业内偏弱。
药渡作为国内老牌医药数据库之一以全球研发数据为核心,重点发展咨询业务。缺少销售数据其核心版块数据,导致其数据业务只是一直低价在为其咨询业务做支撑。
米内
综合推荐指数:★★★★☆
运营企业:广州标点医药信息
上线时间:2010年
数据库数量:72个
产品组成:药品销售(多层格局,医院、零售)、审评进度、上市药品、临床试验、中标数据、全球新药研发、全球专利、项目进度这个七个版块构成
产品特色:国内药品销售数据领头企业,其医院销售数据以“三大终端六大市场”为基础,分层抽样多等级医院放大至全国。城市公立医院、县级公立医院、实体药店、网上药店、城市社区卫生中心、乡镇卫生院等各类维度齐备。
优点:南方所背景,医院销售数据算法和研发数据都做得非常不错。六大格局在国内首屈一指。近期上线了独家的电商类数据,虽然业界还在争议电商数据可信度,但毕竟先走出了这一步。
缺点:全面性比较弱,销售数据以外的全球数据、研发数据、审批数据相对重视程度很低,版本一直没有大的进展。
米内医药数据库南方所背景其医院销售版块覆盖面最广之一,但其它版块相对薄弱。
丁香园Insight
综合推荐指数:★★★☆
运营企业:杭州观澜网络
上线时间:2013年Insight(2006年总部)
产品组成:临床试验、申报进度、药品库、上市产品、制药企业、招投标、一致性评价、医药新闻、生物制品、全球数据等十个版块构成。
数据来源:内部会议、专业报道、专利、商标、在线数据库、在线词典、电子书库、异构资源共享平台、知识库、地区机构、资讯、企业公告报道、医疗会议、新闻资讯等。
产品特色:其界面小功能开发丰富特别是小图标的应用在国内UI设计上是好的,区别于同类产品。
检索方式、功能点、底层数据架构、界面展示:与药智数据库大体一致。
优点:搜索体验、UI界面小功能、时间轴、注册数据、国内药物审评、上市批文这些国内数据中做得非常不错。
缺点:市场和销售相关数据涉及较少,全球研发数据处于刚起步阶段(全球药物研发数据对于药企来说十分重要可谓是医药行业的风向标,在全球药物格局、药物立项调研、企业发展战略方向制定方面的重要性不言而喻)
Insight作为老牌医药数据库的典型代表,背靠丁香园集团的大树,目前国内用户沉积多的数据库之一,但因其药物研发数据版块、药品市场与销售数据起步晚,影响了其总体优势。
上海医工院PDB
综合推荐指数:★★★
运营企业:上海数图健康医药科技
上线时间:2011年
数据库数量:31个
产品组成:分为药物综合和新药研发监测两个数据库;药物综合数据库包含了国内市场、细分市场、全球市场、国内工业生产、企业经济运行五个版块;新药研发监测数据库包含了全球研发、中国研发、一致性评价、企业竞争,品种筛选分析五个版块。
数据来源:专利、商标、技术实施文件、学术会议、技术报告、科技期刊、文献、教科书、地区机构、资讯、新闻资讯、公司年度报告、pjb等。
优点:工信部背景知名度高国产医药数据库鼻祖,审评、临床等数据有不错的关联展示;新上线的RPDB零售板块有明显的优势提升;RAS医药处方分析系统具备一定独家性。
缺点:数据全面性相对不高,部分工业类数据更新较慢,UI设计过于传统。PDB作为全国老牌医药数据库之一,全球药物研发数据采集处于起步阶段,也许是底层架构设计问题单开了一个CPM(新药研发监测数据库)导致其部分关联性较差。
科睿唯安cortellis
综合推荐指数:★★★★☆
产品组成:Cortellis 数据库包含Cortellis竞争情报、Cortellis早期药物发现、CMC、仿制药、原料药、系统生物学Metacore等等多个模块,主要由竞争信息、疾病简报、监管信息、新闻、药物发现信息这几个版块构成;
数据来源:各大药品监管机构、新闻杂志、网络资讯、文献期刊、学术报告、专利商标、公司年报等。
检索方式、功能点、底层数据架构:这三个维度和informa数据库基本一致,只是样式展示风格不一样。
优点: 在展示结果关联性、专业报告、数据维度方面都做得非常好。
缺点: 缺少系统化药品销售数据,对中国企业管线监控出现不少滞后和少量错误,缺少中国药监局等数据分析。
cortellis医药数据库目前在世界医药领域知名医药数据库之一,因在国内因为其水土不服相比之下使用人群比例不是那么多。
英富曼Informa
综合推荐指数:★★★☆
产品组成:Biomedtracker、Pharmaprojects、Sitetrove、Trialtrave、Datamonitor Healthcare、In Vivo、Medtech Insight、Pink Sheet、Scrip多个版块组成。
数据来源:各国药品监管机构、医疗卫生机构、新闻杂志、网络资讯、文献期刊、学术报告、专利商标、公司年报、搜索引擎、学术会议等。
检索方式、功能点、底层数据架构:这三个维度和cortellis数据库基本一致,只是样式展示风格不一样,更符合国人使用习惯。
优点:可以综合计算药物批准通过率,数据更新历史记录,在新闻数据追溯、展示结果关联性、数据维度方面都做得很好。
缺点:没有销售数据、没有仿制药信息、缺少中国药监局数据解读,中国企业管线跟踪滞后;
Informa医药数据库当前世界主流医药数据库之一,其Pharmaprojects版块Pharnexcloud的’全球药物研发版块’被客户比较得多,因为价格和缺少国内审批等数据因此占有率偏低,目前在国内主要客户人群为高校为主。
一共写了目前国内主要使用9个主流数据库的测评,2个国外医药数据库。每个数据库都各有特色,可以根据自身情况供您选择。
大数据在医疗行业的应用可在以下几个方面发挥积极作用:
(1)服务居民。居民健康指导服务系统,提供精准医疗、个性化健康保健指导,使居民能在医院、社区及线上的服务保持连续性。例如,提供心血管、癌症、高血压、糖尿病等慢性病干预、管理、健康预警及健康宣教(保健方案订阅、推送);同时减少患者住院时间,减少急诊量,提高家庭护理比例和门诊医生预约量。
(2)服务医生。临床决策支持,如用药分析、药品不良反应、疾病并发症、治疗效果相关性分析、抗生素应用分析;或是制定个性化治疗方案。
(3)服务科研。包括疾病诊断与预测、提高临床试验设计的统计工具和算法、临床实验数据的分析与处理等方面,如针对重大疾病识别疾病易感基因、极端表现人群;提供最佳治疗途径。
互联网是个神奇的大网,医疗大数据和软件定制也是一种模式,这里报价,这个手技的开始数字是一把柒中间的是叁儿零最后的是一泗贰五零,按照顺序组合起来就可以找到,我想说的是,除非你想做或者了解这方面的内容,如果只是凑热闹的话,就不要来了。
(4)服务管理机构。规范性用药评价、管理绩效分析;流行病、急病等预防干预及措施评价;公众健康监测,付款(或定价)、临床路径的优化等。
(5)公众健康服务。包括危及健康因素的监控与预警、网络平台、社区服务等方面。
除了较早前就开始利用大数据的互联网公司,医疗行业可能是让大数据分析最先发扬光大的传统行业之一。医疗行业早就遇到了海量数据和非结构化数据的挑战,而近年来很多国家都在积极推进医疗信息化发展,这使得很多医疗机构有资金来做大数据分析。因此,医疗行业将和银行、电信、保险等行业一起首先迈入大数据时代。下面列出了医疗服务业5大领域(临床业务、付款/定价、研发、新的商业模式、公众健康)的15项应用,这些场景下,大数据的分析和应用都将发挥巨大的作用,提高医疗效率和医疗效果。
临床 *** 作
在临床 *** 作方面,有5个主要场景的大数据应用。麦肯锡估计,如果这些应用被充分采用,光是美国,国家医疗健康开支一年就将减少165亿美元。
1、比较效果研究
通过全面分析病人特征数据和疗效数据,然后比较多种干预措施的有效性,可以找到针对特定病人的最佳治疗途径。
基于疗效的研究包括比较效果研究。研究表明,对同一病人来说,医疗 服务提供方不同,医疗护理方法和效果不同,成本上也存在着很大的差异。精准分析包括病人体征数据、费用数据和疗效数据在内的大型数据集,可以帮助医生确定 临床上最有效和最具有成本效益的治疗方法。医疗护理系统实现CER,将有可能减少过度治疗(比如避免那些副作用比疗效明显的治疗方式),以及治疗不足。从 长远来看,不管是过度治疗还是治疗不足都将给病人身体带来负面影响,以及产生更高的医疗费用。
世界各地的很多医疗机构(如英国的NICE,德国IQWIG,加拿大普通药品检查机构等)已经开始了CER项目并取得了初步成功。2009年,美国 通过的复苏与再投资法案,就是向这个方向迈出的第一步。在这一法案下,设立的比较效果研究联邦协调委员会协调整个联邦政府的比较效果的研究,并对4亿美元 投入资金进行分配。这一投入想要获得成功,还有大量潜在问题需要解决,比如,临床数据和保险数据的一致性问题,当前在缺少EHR(电子健康档案)标准和互 *** 作性的前提下,大范围仓促部署EHR可能造成不同数据集难以整合。再如,病人隐私问题,想要在保护病人隐私的前提下,又要提供足够详细的数据以便保证分 析结果的有效性不是一件容易的事情。还有一些体制问题,比如目前美国法律禁止医疗保险机构和医疗补助服务中心 (医疗服务支付方)使用成本/效益比例来制定报销决策,因此即便他们通 过大数据分析找到更好的方法也很难落实。
2、临床决策支持系统
临床决策支持系统可以提高工作效率和诊疗质量。目前的临床决策支持系统分析医生输入的条目,比较其与医学指引不同的地方,从而提醒医生防止潜在的错 误,如药物不良反应。通过部署这些系统,医疗服务提供方可以降低医疗事故率和索赔数,尤其是那些临床错误引起的医疗事故。在美国Metropolitan 儿科重症病房的研究中,两个月内,临床决策支持系统就削减了40%的药品不良反应事件数量。
大数据分析技术将使临床决策支持系统更智能,这得益于对非结构化数据的分析能力的日益加强。比如可以使用图像分析和识别技术,识别医疗影像(X光、 CT、MRI)数据,或者挖掘医疗文献数据建立医疗专家数据库(就像IBMWatson做的),从而给医生提出诊疗建议。此外,临床决策支持系统还可以使 医疗流程中大部分的工作流流向护理人员和助理医生,使医生从耗时过长的简单咨询工作中解脱出来,从而提高治疗效率。
3、医疗数据透明度
提高医疗过程数据的透明度,可以使医疗从业者、医疗机构的绩效更透明,间接促进医疗服务质量的提高。
根据医疗服务提供方设置的 *** 作和绩效数据集,可以进行数据分析并创建可视化的流程图和仪表盘,促进信息透明。流程图的目标是识别和分析临床变异和医 疗废物的来源,然后优化流程。仅仅发布成本、质量和绩效数据,即使没有与之相应的物质上的奖励,也往往可以促进绩效的提高,使医疗服务机构提供更好的服 务,从而更有竞争力。
数据分析可以带来业务流程的精简,通过精益生产降低成本,找到符合需求的工作更高效的员工,从而提高护理质量并给病人带来更好的体验,也给医疗服务 机构带来额外的业绩增长潜力。美国医疗保险和医疗补助服务中心正在测试仪表盘,将其作为建设主动、透明、开放、协作型政府的一部分。本着同样的精神,美国 疾病控制和预防中心 。
公开发布医疗质量和绩效数据还可以帮助病人做出更明智的健康护理决定,这也将帮助医疗服务提供方提高总体绩效,从而更具竞争力。
4、远程病人监控
从对慢性病人的远程监控系统收集数据,并将分析结果反馈给监控设备(查看病人是否正在遵从医嘱),从而确定今后的用药和治疗方案。
2010年,美国有1.5亿慢性病患者,如糖尿病、充血性心脏衰竭、高血压患者,他们的医疗费用占到了医疗卫生系统医疗成本的80%。远程病人监护 系统对治疗慢性病患者是非常有用的。远程病人监护系统包括家用心脏监测设备、血糖仪,甚至还包括芯片药片,芯片药片被患者摄入后,实时传送数据到电子病历 数据库。举个例子,远程监控可以提醒医生对充血性心脏衰竭病人采取及时治疗措施,防止紧急状况发生,因为充血性心脏衰竭的标志之一是由于保水产生的体重增 加现象,这可以通过远程监控实现预防。更多的好处是,通过对远程监控系统产生的数据的分析,可以减少病人住院时间,减少急诊量,实现提高家庭护理比例和门 诊医生预约量的目标。
5、对病人档案的先进分析
在病人档案方面应用高级分析可以确定哪些人是某类疾病的易感人群。举例说,应用高级分析可以帮助识别哪些病人有患糖尿病的高风险,使他们尽早接受预防性保健方案。这些方法也可以帮患者从已经存在的疾病管理方案中找到最好的治疗方案。
付款/定价
对医疗支付方来说,通过大数据分析可以更好地对医疗服务进行定价。以美国为例,这将有潜力创造每年500亿美元的价值,其中一半来源于国家医疗开支的降低。
1、自动化系统
自动化系统(例如机器学习技术)检测欺诈行为。业内人士评估,每年有2%~4%的医疗索赔是欺诈性的或不合理的,因此检测索赔欺诈具有巨大的经济意 义。通过一个全面的一致的索赔数据库和相应的算法,可以检测索赔准确性,查出欺诈行为。这种欺诈检测可以是追溯性的,也可以是实时的。在实时检测中,自动 化系统可以在支付发生前就识别出欺诈,避免重大的损失。
2、基于卫生经济学和疗效研究的定价计划
在药品定价方面,制药公司可以参与分担治疗风险,比如基于治疗效果制定定价策略。这对医疗支付方的好处显而易见,有利于控制医疗保健成本支出。对患 者来说,好处更加直接。他们能够以合理的价格获得创新的药物,并且这些药物经过基于疗效的研究。而对医药产品公司来说,更好的定价策略也是好处多多。他们 可以获得更高的市场准入可能性,也可以通过创新的定价方案,更有针对性疗效药品的推出,获得更高的收入。
在欧洲,现在有一些基于卫生经济学和疗效的药品定价试点项目。
一些医疗支付方正在利用数据分析衡量医疗服务提供方的服务,并依据服务水平进行定价。医疗服务支付方可以基于医疗效果进行支付,他们可以与医疗服务提供方进行谈判,看医疗服务提供方提供的服务是否达到特定的基准。
研发
医疗产品公司可以利用大数据提高研发效率。拿美国为例,这将创造每年超过1000亿美元的价值。
1、预测建模
医药公司在新药物的研发阶段,可以通过数据建模和分析,确定最有效率的投入产出比,从而配备最佳资源组合。模型基于药物临床试验阶段之前的数据集及 早期临床阶段的数据集,尽可能及时地预测临床结果。评价因素包括产品的安全性、有效性、潜在的副作用和整体的试验结果。通过预测建模可以降低医药产品公司 的研发成本,在通过数据建模和分析预测药物临床结果后,可以暂缓研究次优的药物,或者停止在次优药物上的昂贵的临床试验。
除了研发成本,医药公司还可以更快地得到回报。通过数据建模和分析,医药公司可以将药物更快推向市场,生产更有针对性的药物,有更高潜在市场回报和 治疗成功率的药物。原来一般新药从研发到推向市场的时间大约为13年,使用预测模型可以帮助医药企业提早3~5年将新药推向市场。
2、提高临床试验设计的统计工具和算法
使用统计工具和算法,可以提高临床试验设计水平,并在临床试验阶段更容易地招募到患者。通过挖掘病人数据,评估招募患者是否符合试验条件,从而加快 临床试验进程,提出更有效的临床试验设计建议,并能找出最合适的临床试验基地。比如那些拥有大量潜在符合条件的临床试验患者的试验基地可能是更理想的,或 者在试验患者群体的规模和特征二者之间找到平衡。
3、临床实验数据的分析
分析临床试验数据和病人记录可以确定药品更多的适应症和发现副作用。在对临床试验数据和病人记录进行分析后,可以对药物进行重新定位,或者实现针对 其他适应症的营销。实时或者近乎实时地收集不良反应报告可以促进药物警戒(药物警戒是上市药品的安全保障体系,对药物不良反应进行监测、评价和预防)。或 者在一些情况下,临床实验暗示出了一些情况但没有足够的统计数据去证明,现在基于临床试验大数据的分析可以给出证据。
这些分析项目是非常重要的。可以看到最近几年药品撤市数量屡创新高,药品撤市可能给医药公司带来毁灭性的打击。2004年从市场上撤下的止痛药Vioxx,给默克公司造成70亿美元的损失,短短几天内就造成股东价值33%的损失。
4、个性化治疗
另一种在研发领域有前途的大数据创新,是通过对大型数据集(例如基因组数据)的分析发展个性化治疗。这一应用考察遗传变异、对特定疾病的易感性和对特殊药物的反应的关系,然后在药物研发和用药过程中考虑个人的遗传变异因素。
个性化医学可以改善医疗保健效果,比如在患者发生疾病症状前,就提供早期的检测和诊断。很多情况下,病人用同样的诊疗方案但是疗效却不一样,部分原因是遗传变异。针对不同的患者采取不同的诊疗方案,或者根据患者的实际情况调整药物剂量,可以减少副作用。
个性化医疗目前还处在初期阶段。麦肯锡估计,在某些案例中,通过减少处方药量可以减少30%~70%的医疗成本。比如,早期发现和治疗可以显著降低肺癌给卫生系统造成的负担,因为早期的手术费用是后期治疗费用的一半。
5、疾病模式的分析
通过分析疾病的模式和趋势,可以帮助医疗产品企业制定战略性的研发投资决策,帮助其优化研发重点,优化配备资源。
新的商业模式
大数据分析可以给医疗服务行业带来新的商业模式。
汇总患者的临床记录和医疗保险数据集
汇总患者的临床记录和医疗保险数据集,并进行高级分析,将提高医疗支付方、医疗服务提供方和医药企业的决策能力。比如,对医药企业来说,他们不仅可 以生产出具有更佳疗效的药品,而且能保证药品适销对路。临床记录和医疗保险数据集的市场刚刚开始发展,扩张的速度将取决于医疗保健行业完成EMR和循证医 学发展的速度。
公众健康
大数据的使用可以改善公众健康监控。公共卫生部门可以通过覆盖全国的患者电子病历数据库,快速检测传染病,进行全面的疫情监测,并通过集成疾病监测 和响应程序,快速进行响应。这将带来很多好处,包括医疗索赔支出减少、传染病感染率降低,卫生部门可以更快地检测出新的传染病和疫情。通过提供准确和及时 的公众健康咨询,将会大幅提高公众健康风险意识,同时也将降低传染病感染风险。所有的这些都将帮助人们创造更好的生活。
未来资本对大数据的争夺战已经开始。据媒体报道,2013年至2014年以来, 大数据是互联网医疗健康主要并购投资领域之一。前身为中国首家专业从事医院信息系统软件开发与应用工程企业的北大医疗信息技术有限公司(下称“北大医信”)已经瞄准了医疗大数据的战略方向。
今年3月,北大基金会向北大医信投资3000万,这是北大史上投资最大的“真金白银”。在3月14日的北大医信成立大会上,方正集团高级副总裁、方正信产集团CEO方中华直接给其赋予了重任:“北大和方正集团的大力支持、大数据时代带来的无限机遇,都应该让我们感到,我们的事业之无上光荣光荣的背后是任重道远,必须要共同努力将北大、方正赋予北大医信的使命完成好、做好大数据事业,不仅要做北大大数据中心,未来还要做国家级、世界级的大数据中心。”
12月11日,弘毅投资、高盛、东软控股及协同创新等投资者共同对东软熙康进行1.7亿美元的增资。东软熙康是东软集团旗下专门从事互联网医疗和健康管理的公司,致力于通过大数据,云计算、物联网、移动互联网提供基于O2O模式的健康管理与医疗服务平台,这笔投资刷新了国内互联网医疗与健康管理领域最大单笔融资的纪录,也是全球互联网医疗与健康管理领域最大单笔融资之一。
上海医联工程已经建立了国内目前医疗机构联网范围最大的临床信息共享系统。该工程的承建商万达信息股份有限公司(下称“万达信息”),2014年7月收购上海复高计算机科技有限公司,8月收购宁波金唐软件股份有限公司。这两个公司都是在医疗信息化领域做了十多年的企业。
万达信息股份有限公司总裁助理冯东雷告诉网易科技,万达信息加上新收购的两个子公司,现在一共有员工3500人左右,其中从事与医疗健康相关的有事业部和子公司,员工共有1500人左右,是万达信息业务中最大的一块。
上海金仕达卫宁软件股份有限公司是一家专业从事医疗卫生领域信息化、数字化、软件研究与开发的高科技企业。徐春华告诉网易科技,金仕达卫宁做数据处理是原有业务的一种延伸,但是在过去一年当中,他发现,涉足医疗大数据领域的不光传统的做医疗IT软硬件服务的企业,甚至还有许多跨界的、之前和医疗没关系的上市公司,例如以地产起家的运盛实业、浓缩果汁生产企业国投中鲁等。
而在日前的“2014年中国移动医疗产业年会”上,中国移动、中国电信、中国联通、IBM、保险公司招商信诺等,还有各种健康管理公司都参与了主题为“健康大数据 全民大健康”的论坛。
企业之外,医院和各路研究机构也在尝试开展医疗大数据的研究。11月29日,中国科学院深圳先进技术研究院健康大数据研究中心成立。北京大学正在筹备成立北大医疗健康大数据中心。最近两个月,冯东雷拜访了北京大学、浙江大学、中山大学、中南大学等几所高校,“这些高校都希望在大数据方面和我们进行合作。”他透露。
2014年10月18日,首都医科大学附属北京安贞医院和辉瑞投资有限公司合作的国内首个心血管医疗大数据中心项目启动。
临床应用:还不成熟
目前对医疗大数据的需求集中在在三个层面:运营管理、辅助治疗和辅助科研。在业界看来,目前在中国,医疗大数据已经取得良好效果的是行政管理。
北京市公共卫生信息中心统计室主任郭默宁告诉网易科技,目前在数据的挖掘和利用方面,北京市公共卫生信息中心做的比较有成效的是对医疗机构进行绩效分析。
以前,对医疗机构进行绩效评价并不容易,因为每个病人病情各异,医疗机构的工作难度和工作效果很难衡量,医疗机构之间进行对比也非常困难。郭默宁告诉网易科技,以往对医疗机构进行绩效评估的通常模式是找专家给医院评分,依据经验和主观判断比较多。
2008年开始,北京市公共卫生信息中心尝试根据通过数据挖掘得来的指标对辖区内医疗机构进行绩效评价。她告诉网易科技:“利用统计学方法,可以把医疗机构收治的病症相似的病人进行分组,这样在同组病人当中,就可以比较各个机构的服务优劣了。这样可以促进医疗机构精细化管理,提高医疗服务的质量。”
郭默宁告诉网易科技,未来在公共卫生领域,医疗数据的挖掘和利用的前景是非常广阔的。比如,在医疗卫生资源规划、配置,疾病预警等方面都会得到充分的应用。
在临床辅助治疗和辅助科研方面,已经有机构在进行探索和尝试,但是目前尚不成熟。
万达信息之前研发的“临床辅助决策系统”在业界比较知名,其目前可以在上海市38家市级医院向医生提供近期重复用药、检验、检查的提醒、治疗安全警示以及临床路径(是指针对某一疾病建立一套标准化治疗模式与治疗程序,是一个有关临床治疗的综合模式,以循证医学证据和指南为指导来促进治疗组织和疾病管理的方法,最终起到规范医疗行为,减少变异,降低成本,提高质量的作用)服务。
但是,冯东雷告诉网易科技,这些功能的提供,实际上需要做知识库的建设,但是现在的知识库都是基于现有的教科书、药品使用说明以及一些临床手册,都比较简单,今后要把医生的真实的看病的经验也输入进来,才能在临床上发挥更大的意义,这才是真正的大数据挖掘。他透露,在即将开展的“心血管疾病和肿瘤疾病大数据处理分析与应用研究”的项目中,就有心血管、肿瘤专家参与进来。
2012年,万达信息、国家卫生工程中心就申请了上海市科委医疗健康大数据的课题。在这个项目中,万达信息尝试了对高血压进行大数据分析,试图找到病症、用药和疗效之间的关联。但是冯东雷告诉网易科技,这样的分析目前遇到一些困难。以往的临床研究(随机对照试验RCT)是用实验组和对照组进行的,对照组是一些排除了并发症等相对理想的对照人群。样本量小,但每个样本的数据颗粒很细。但是用医疗大数据做分析的话,样本量很大,但是每个样本数据颗粒比较粗。因此不能套用传统RCT的研究方法。因此需要新的研究思路。目前用大数据已经发现了一些治疗手段和效果的关联性,但是这种结论在临床使用上有多大的意义还有待检验。
这样的研究还在继续。国家“863”计划2015年度项目申报指南中,在生物和医药技术领域已经部署“生物大数据开发与利用关键技术研究”,涉及的内容包括生物大数据标准化和集成、融合技术,生物大数据表述索引、搜索与存储访问技术,心血管疾病和肿瘤疾病大数据处理分析与应用研究,基于区域医疗与健康大数据处理分析与应用研究,组学大数据中心和知识库构建与服务技术等。
万达信息参与了其中的两项,分别为“基于区域医疗与健康大数据处理分析与应用研究”,以及“心血管疾病和肿瘤疾病大数据处理分析与应用研究”。其中后者开展面向中医的心血管疾病和肿瘤疾病大数据分析与应用的研究。
北大医信也在与北京大学合作,研究临床医疗大数据的分析和利用。北大医信服务过的医院超过500家,其中三甲医院200多家,占全国三甲医院总数的1/4左右,北京大学下属有9家附属医院、13家教学医院,这些医院信息系统中积累的大量数据,为进行大数据分析和利用打下了坚实的基础。
北大医信资深副总裁兼CTO邹悦告诉网易科技,目前北大医信的临床决策支持体系正在北京大学人民医院、北京大学国际医院、江苏省人民医院进行试点。
北大医信已经开发了临床预警和建议类的应用。预警类的应用可以根据患者的一些生命体征,判断患病风险并进行提示。建议类的应用,目前北大医信做了糖尿病这个病种,系统可以根据糖尿病人的症状、检验检查结果和病历,给出相应的治疗方案建议。
在临床科研方面,北大医信也做了一些数据分析,并且得到了一些结果。比如,以往子宫内膜异位和子宫肌瘤的误诊率高达65.1%,因为两种疾病的症状非常相似。通过大数据分析发现,卵巢囊肿、腹痛、贫血这三种症状在这两种病中的权重是不同的,子宫内膜异位与卵巢囊肿的关联最强,子宫肌瘤和贫血的关联最强。
“我们分析出了这个结果,但是在临床上怎么用,还要再进一步探讨。”邹悦介绍。
好医生集团董事长高瞻认为,要让大数据产生价值,需要有一条完整的价值链,目前中国的这个价值链还有缺失。大数据的价值链有数据的收集、储存、分析、应用四个环节,但是目前这个产业投入比较多的是收集和储存,分析和应用还比较弱。即使在投入较多的数据收集环节,由于缺乏相应的机制,数据的质量也不是很高。
业内者说:怎么做
在目前的情况下,如何做好大数据?高瞻认为,应当先抓住一些关键业务需求,同时数据基础比较好,先做起来,然后再逐步扩展。他举了两个例子。
好医生集团曾参与过安徽省肥西县卫生局的一个项目。据高瞻介绍,肥西县卫生局将新农合医疗报销系统的数据和卫生局为居民建立的电子健康档案做了一个关联性分析。结果发现,居民的肥胖、抽烟与高血压、糖尿病的发病关联性很强。高瞻告诉网易科技,这不是什么新的发现,但是应用大数据分析的意义在于,之前大家只是从概念上知道肥胖和抽烟会对高血压和糖尿病产生影响,用大数据分析之后,能够真实地看到具体的一个个人的肥胖和抽烟对病症产生了影响。之后,社区医院应用了这个分析结果,给高血压病人、糖尿病病人看病时不光降血压、降血糖,还要干涉患者的肥胖和吸烟。现在整个肥西、还有安徽的很多县都在推广这样的做法,这一个小小的改变,使得很多地方的居民电子健康档案的使用率从20%左右变成了60%—70%,医生们本没有使用积极性的数据库被激活了。
肥西还做了个试验。原来农村治病,不管大人小孩,一般都是开抗生素、输液,好医生集团多年来做乡村医生的培训,呼吁不要滥用抗生素,但是在实际中效果不大。今年年初,安徽省启动了基层医疗卫生机构处方集系统,这个系统可以根据疾病诊断,提示建议处方,旨在规范诊疗行为和用药行为。同时,从今年2月开始,肥西县卫生局每月把医生处方当中使用两种以上抗生素的处方的比例发给医生。结果到了10月份,原来高达20%-60%的数据降到了个位数。
高瞻总结,大数据应用应当先从“Low hanging fruits”,即挂得低的果子、容易达成的目标开始,先把手头有限的“小数据”用好。
这个观点与北京301医院计算机室原主任任连仲不谋而合。
任连仲告诉网易科技,目前中等规模以上的医院起码都积累了数百GB的数据,每100GB的数据就相当于30万份病历。虽然这个数量级还没达到PB级,但是其中一定蕴含着许多有价值的信息。
他拿自己的观察举例说:“我观察了我身边20个左右患恶性肿瘤的人,我发现其中六七成的人在生活中有过非常苦恼郁闷的一段时期。20个样本,就可以总结出一点规律了,何况这个样本量大到GB级呢?那会得到更多、更有价值、更准确的结论。”
他主张先把目前的数据利用起来,现在301医院那些成摞的申请单就是真实的需求。他说:“目前在医院里,这样的服务还是被动的,是医生找上门来我们才提供服务,如果这种服务再进一步走上主动,广而告之,告诉广大医护人员和管理人员我们这里可以提供你们所需的‘信息服务’,医生在和技术人员在不断交流的过程中,一定能挖掘出大数据更大的价值。”
任连仲今年80岁,但是老爷子嘴里蹦出的词是“快速迭代”,按照他的说法:“好工具是用出来的。这是一个巨大的市场,这个事我们不能等。”
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)