白癜风资深医生 http://pf.39.net/bdfyy/bdflx/180503/6210229.html医改*策不断落地的背景下,药企面临销售、市场之困惑,终端药店成为药企的必争之地。连接制药企业与零售药店的“关键点”,是采用先进的互联网技术+大数据分析技术,从而实现药企的数据驱动变革。
本期极客我们邀请到来自未名企鹅北京研发中心的研发总监Tony,探讨对如何透过多维度标签构成终端用户画像的一些思考。
医药渠道流向数据与用户画像技术的应用
1
流向数据分析之困惑
药企制药行业药品流向数据(销售、库存、采购)是企业的重要数字资产之一,是做数据分析核心数据,也是企业决策和管控的重要数字依据,那么做好药品流向数据分析尤为重要。但同时也面临几个问题/p>
数据量巨大(百万级别);数据无序(字段多,杂乱);数据源多(文件、数据库、邮件);面向管理的数据分析,以及部门之间、内部的数据分析复杂、需求多,数据分析维度多。
2
解决之道-标签体系
我们先看一下经过企鹅智慧PenguinM.I.N.D.处理后的药品流向数据长什么样子?我们以销售流向数据(截取核心字段)举例:
可以看到一条流向数据字段多达20个之多,如果我们通过传统的Excel去按照各种条件去筛选,效率低下、复杂可想而知。
那么最佳的实践方案就是采用数据标签化、终端标签化,通过贴标签构建流向数据画像,从而真正让数据活起来,以最低成本最大限度的挖掘数据的生命价值,激活企业数字资产,已达到构建企业数据价值体系。
3
构建标签体系好处
1.实现精准营销:
精准营销是标签终端画像重要优势之一,通过快速、方便通过不同的标签组合圈定一批目标终端后,可实现精准营销测试制定,及对营销效益的精准评估,以及清晰展示市场机会、市场规模。
2.多维分析,提高决策的效率:
基于标签的多维数据分析是一项做数据分析的重要能力,可以更好的服务数据分析人员,解决销售、管理、业务人员等不同维度的管理数据分析、及决策需求,而且基于同一套标签体系,很容易实现一致性讨论、决策。
4
未名企鹅标签体系建设实践
明确几个概念:
1.标签(Tag):
对某一类特定群体或对象的某项特征进行的抽象分类和概括,其值(标签值)具备可分类性。
2.标签值(TagValue):
标签的实例,指某一标签所包含的具体内容,其特点是符合MECE原则(相互独立、完全穷尽)。
3.用户画像(UserProfile):
由某一特定群体或对象的多项特征构成,输出结果通常是对特征的具体描述。(也可理解为用户画像是由多个标签组合而成,其实例是由多个标签值构成)。
5
建立标签系统目标
1.数据标签可视化、可配置、维护,更改及时生效;
2.支持标签规则化(采用ScriptEngine技术)和标签依赖关系配置实现企业复杂多变要求;
3.采用大数据处理引擎技术,对百万流向数据根据标签配置规则瞬间完成数据标签自动建立维护,具备实时标签能力;
4.满足平台多租户,多维度标签建立配置,可实现对客户主数据、销售流向数据、库存流向数据建立多维度标签;
5.支持不同年度的历史数据的标签维护,实现当前架构看历史,历史架构看历史的数据分析要求;
6.打标签实时可验证、可测试,提高数据标签的准确性。
6
标签系统的结构
数据处理层:
业务功能要点:数据通过数据源获取数据,数据经过清洗和匹配、去重、去无效、去异常等等,将数据转换为标准数据格式。
技术架构要点:大规模的DDI数据采集,ELT数据处理、短文本匹配、文本相似度计算、数据血缘关系分析计算,数据特征提取,机器学习技术等。
标签业务层/p>
业务功能要点:此层是实现标签功能核心所在,主要是实现对标签配置,及实现对数据的建立标签画像,它主要用来维护整个标签体系管理。例如实现标签定义、标签定义分类、标签规则,标签数据处理标注,标签标注的验证测试,标签版本、标签编辑修改更新、标签应用业务服务(搜索推荐、数据预测等等)。
技术架构要点:标签的规则引擎技术(RuleEngine)、并行计算技术、内存数据计算、微服务API(MicroService)、分布式多级缓存技术(Cache)、事件驱动技术(EventBus)、数据推荐算法。
数据应用层:
业务功能要点:数据标签的可视应用最终体现在前端展示,赋予药企人员标签的工具能力,聚合业务数据,构建更加贴近企业真实易用的数据应用分析场景。标签数据可以应用在数据明细查询,数据图表,数据大屏,数据导出,数据洞察、数据预测,数据决策等方面。
写在最后:
以上简单和大家介绍了未名企鹅在医药大数据分析方面标签体系应用成果,未来未名企鹅将继续以医药产业互联网及数据解决方案专家身份,提供先进的互联网技术和理念,帮助客户通过数据驱动营销闭环,助力企业发展,实现精益成长。
文/Tony
编辑/TiK
设计/晓楠
对我们的团队和技术感兴趣?
机会在这里:未名企鹅春季诚意招聘