主页
分类
首页 > 经典文学 >

哪里买数据(消费数据从哪获得)

本文回顾了一个购买药学服务数据的案例,介绍了当时遇到的治疗方法和问题。

“买数据”案发生在医药o2o电商平台上。药品是一种特殊的电子商务商品,可以作为增值的载体。例如,在销售药品的同时,它还提供健康服务,以缩短“人和货场”的温度与医药服务,创造一个线上和线下工业化的新型零售生态系统。

药物附加服务的前提是,无论是药物指导、寻求医疗建议还是患者画像,都要有药物与疾病关系的数据源。

这些数据应该是权威和准确的,易于理解,科学和普及。在市场上获得纯医学数据或纯药物商品数据并不困难。难以获取的是医疗电子商务人群的医疗健康信息和故事场景。

本案涉及内容清单:

1、初步需求分析1、分析需求

根据项目规划,该药学服务的需求场景总结如下:

这要求数据中至少涉及以下领域:用法和剂量、功能适应症、适用人群、禁忌不良反应、用药周期、治疗疾病、疾病症状、疾病描述等。结合业务场景,可以绘制这样一个简单的图表:

2、确定核心要素

根据以上要求,我们可以知道“药”、“病”和“病”是核心,其关系如下:

这三种关系是多对多的,如下所示:

3、评估数据量

常规药物的数量已达到60000(SKU)。

药品基本上是单一规格(不同的内容被视为不同的规格,不同内容的不同声明,以及行业中不同的商品)。因此,有必要准备接近这一数字的药物材料,以确保覆盖率。

小结:到目前为止,从需求要素、核心内容和需求数据量的范围描述了要获取的数据的概要,可以作为寻找数据源的验收标准或参考。

2、通过研究获取数据的方法

我们的目标数据是客观标准的基础数据,而不是操作生成的数据。因此,权威和客观性是最重要的,那么如何获得它们呢?

1、如果你自己维护?

请指定专人查找药箱,阅读药品说明书,输入,然后阅读医学词典数据,并据此整理疾病信息。。。平均来说,一个人每天最多可以得到100件物品,计算60000件物品需要很长时间。

显然,它太晚了,太贵了,没有经过验证的数据,我不敢使用它。这条路过去了。

2、攀爬他人数据

药品信息在药品监督管理局官方网站上相当权威,但没有疾病,甚至无法找到条形码(注:条形码,国内是代码69,唯一的商品标识,由13、12或8位数字组成)。

爬行到其他网站也有尝试,但结果不准确,不完整,或成功,这条路不会奏效。

3、采购数据

购买数据比爬行数据更正式。我咨询了京东阿里和腾讯紫丁香,但他们不卖。这些公司需要自己提供数据服务,他们不需要这些钱。

咨询药店后。com和135。com,没有关于疾病便利性的可靠数据。这时,业内人士推荐了一家名为“雅”的公司。在进行药学服务时,他们决定进行深入讨论。

3、获取样本数据

经协商,对方提供了一批Excel格式的样本数据。桌子里有14张桌子。获得数据后,将进行初步验收。

1、比较E-R模型

他们的数据由mongdb存储,并首次提取用于销售,因此数据在表结构和表号上是冗余的。通过其表格结构,绘制了E-R图,基本满足要求。

2、竞争产品横向比较

在检查样本数据的过程中,还对备选方案进行了比较。

制定检查的关键点是:单表数据的错误率、联合表查询的匹配率、市场数据的覆盖率、错误修复的及时性等。从网站或应用程序中寻找类似的产品,但它们都有各种问题,最后放弃了其他选择。

3、远程全检数据

如果未付款,另一方将不提供完整数据。

由于样本有限,为了进一步了解数据,协商采用远程数据库搜索。另一方在数据库中进行了单表验证和联合表查询。我们远程观察并记录检查结果。

毕竟,远程操作很不方便。交叉抽样仅验证了部分数据,估计精度为93%,这也是决定继续谈判的主要参数。

4、支付首付款并获取全部数据

下一个过程是讨论价格。一旦协商好价格,您就可以打包并销售数据。

我们降价的主要理由是:疾病数据不足1万,回购后仍需补充人工成本;非独家买断,可以复制销售,卖家的边际成本很低,且内容质量不高。

口头声明由执业药师团队、药师专业的药师和中国非处方药协会审查。然而,没有证据,最终获得了折扣,并起草了完整数据验收合同。

当时合同内容相对简单,草案截图如下:

签订合同后,我们得到了全部数据。

双方同意在一周内进行数据验收,验收无误后支付余款。由于数据的敏感性,由专人以电子邮件压缩包文档的形式接收。然后将其存储在堡垒机中,其他参与验收的人员将通过堡垒机进行检查。

1、研究数据质量

检查数据的合理性:即数据在逻辑组织上是否存在缺陷。

数据关联度:导入数据库后,采用Excel上手动比较和程序员SQL查询相结合的方法。在了解基础数据的基础上,制定了检验计划,具体内容如下:

2、检查数据的权威性

这需要专业药剂师或制药人员的参与。我们采用抽样调查的方法,比较的基准是药典的权威数据,如“阿苯达唑”的服用时间和药物禁忌。

3、数据覆盖率

所采用的方法是指定20种常用药物(如醋氨酚),以查看是否可以找到完整的数据集,结论是数据并不理想。

例如,使用条形码匹配现有商品,未找到1579项,占20.87%;使用这1579个常用名称,其中147个仍然缺失,即绝对缺失的比例为1.9%。

4、数据冗余

许多表是从mongdb转换而来的,因此表之间的结构不合理。最后,在14张表格中,有7张是有用的,其余大部分是多余的表格(尽管在初步验收期间也发现了这些表格)。

5、双方协商

事实上,你可以看到,测试结果的完整数据量并不理想。

主要表现在表结构不合理;数据中存在错误,每个表中某些名词的表达不一致。然而,在此期间,合同的协议对买方不利,因此我们只能向前推进。

在一周内,我们输出一个问题列表,挑出合同中的文字,寻找有利的机会,然后命令另一方清理数据并再次移交。

5、数据购买后的应用程序规划

经过五次数据交付,双方法务部门达成协议,调整价格,最终完成交易。

如果验收被视为一个项目,尽管项目不是很漂亮,但数据仍然有价值和可用性。

获取数据,并在技术层面进行应用规划:第一步是检查和清理元数据,并将14个表提取到整洁的新表中;第二步是指定底层服务逻辑作为数据控制台,并提供端到端接口调用。

例如:

步骤3:连接特定的业务场景并输出特定的解决方案(此处省略)。

6、摘要1、本次数据购买主要涉及三个方面从产品角度看需求的一致性;医学视角下的数据权威;法律层面的合同条款:后两点做得不好,尤其是在法律事务方面,这导致在获得了大量数据后陷入了困境。

然而,该项目本身也有局限性和困难:例如,由于数据量大,很难找到细节;缺乏标杆,自我评价只能是抽样调查的方式;数据的价格没有固定的标准,很难掌握。

2、从数据购买中吸取的经验教训

数据需求和目标的范围明确;了解卖方及其数据的影响;在购买之前,你应该知道还有谁购买或使用过它,并调查其声誉;在另一方接触之前,在行业和技术方面制定充分的验证标准和计划;制定项目基本步骤,如:前期研究、成本评估、采购谈判、后约束;在获得全部数据之前,我们应充分采取远程调查的手段,挖掘对方的数据泄露或不足,作为合同协议和谈判的前提;在合同的签订中,对“破损货物”风险的识别标准和卖方的责任更为一致。该文件必须提供给行业专家和法律事务,以便他们在未来获得真实数据后可以前进或后退;合同应规定验收过程中问题的处理方法,由谁负责验收费用、验收失败的最大次数等。

#专栏作家#

图片来自unsplash,基于cc0协议

文章地址:https://www.dghbs.net/304312.html

小编提醒:本文由bbq辛苦创作上传投稿,本站拥有所有权内容供参考学习,未经书面授权禁止转载!转载请注明出处且承担相关法律责任。

本文网址:http://www.taop410.com/jdwx/18416.html

阅读推荐

Copyright © 2019 小红帽阅读网 All Rights Reserved    网站导航|网站地图   

© 2020 小红帽阅读网