常见问题      欢迎来到牛博士论文网, 本站提供、本科毕业论文范文硕士论文范文博士毕业论文范文发表职称论文范文,牛博士用心为您服务!欢迎关注微信公众号   
理工论文毕业论文分类>>
毕业论文怎么写更多写论文技巧>>
关于我们
    牛博士论文网经过十余年的心酸代写历程,我们起初的梦想逐渐变成了现实,已经发展成为了一个本科、硕士、博士研究生毕业论文代写代发为主的代写毕业论文平台。十二年专注致力于博士硕士专本科论文代写服务这一核心业务模块,让我们成为了业内有序经营时间最长的综合性论文网站之一,拥有丰富的服务经验和社会资源。合作的写作老师已有2000多位,均为有丰富实践经验的高学历专业人才,以保证文稿的质量与版权,为广大毕业生解决经济、管理、法律、医学、会计、体育、历史、教育教学、建筑等专业的毕业论文及代发代写论文等服务,强大的写作团队奠定了我们的实力! 我们相信通过我们的不断努力和追求,一定能够实现与客户的互利共赢!

数据挖掘-医院业务数据分析

本站原创   发布时间:2018-11-24   [点击量:13548]  


摘要

随着信息行业的发展,我们很多大型医院都建立起了医院信息系统 (Hospital Information System, HIS),信息量的不断增多,数据复杂程度的逐步增加,随之产生大量冗余的医院信息处理数据。如何快速有效地对海量医学数据进行存储管理和对比检索,从中发现数据之间的相关性,挖掘数据中所存在的规律,以及对数据进行自动获取,提高信息利用率,从而制定正确医院运营目标,使医院能在激烈的竞争中保持先进,是医院如何在现代信息化社会中快速发展亟待解决主要问题。

    本文首先介绍数据挖掘的基本概念和内容,并对医院的病案信息抽取原进行分析研究,为医院的医疗服务、综合管理、经济效益和宏观决策提供前瞻性的预测和指导。


关键字:数据挖掘,医院管理,HIS


如今快速发展的社会中,计算机技术使得全球信息化的进程迅猛加快,而医院信息化正是社会信息化不可缺少的组成部分,同样是实现医院现代化管理的重要步骤。HIS在全球得到了飞速发展和普及,信息化建设让医院的工作流程和整体效率都产生了质的飞跃和提高,并且进一步改善了医疗行业的服务质量,提高了全社会经济效益和医院综合科学管理水平。

在医院信息化建设的进程中,如何提高数据挖掘技术基于数据挖掘技术的医院信息化建设应用研究在医院信息系统中的运用水平是医院深化改革、强化机制的重要措施,这对提高医院服务质量和综合技术水平来说都具有重要意义。数据挖掘技术在医院信息系统管理的用途有以下几点:(1)提高了疾病诊断和治疗的水平;(2)提高了对复杂医学数据的分析水平;(3)加强了对疾病的预测功能;(4)完善医院管理的流程进度;(5)促进医疗事业的全面发展。

本论文分共为七个章节,两大部分。前半部分主要阐述关于数据挖掘的基本概念和内容,包括数据挖掘的对象,任务,步骤及常用方法;后半部分针对医院医疗病案信息进行分析展示。












第一章 定义

    1.1 数据挖掘的定义(技术层面)

    人们给数据挖掘下过很多定义,由此而衍生的内涵也有所不同。从技术的角度简单的说,数据挖掘是指从大量的、不完全的、有噪声的、随机的实际应用数据中,提取隐含在其中的人们实现不知道的,但是又是潜在有用的信息和知识的过程,并且,对所提取的信息按多种方式进行分析。[1]


   1.2 商业角度的定义(商业层面)

    从商业应用角度看,数据挖掘是一种信息化商业数据处理技术。其主要特点是对商业数据库中的大量业务数据进行抽取、转换、分析和其他模型化处理,从中提取辅助商业决策的关键性知识。









第二章 任务

    2.1预测任务

    (一)数据抽取:数据抽取目的是对数据进行紧凑描述,最简单的数据抽取方法是对数据库的各个字段上的求和、平均、取MAX或MIN等统计值,或者用条形图、折线图、柱状图等图形方式表示。

(二)分类发现:分类的目的是为了产生一个分类函数,该函数可以产生一对一的映射,即能把数据库中的数据项目映射到给定的某个类别中。从大量的历史数据中推导出给定数据的推广描述,从而对未来进行预测。

(三)聚类

聚类是将本身没有类别的样本聚集成不同的组,一组数据对象的集合称作“簇”,然后对每一个这样的簇进行描述的过程。聚类的目的是尽可能缩小属于同一类别的个体之间距离,增大非同类别个体之间的距离。

  2.2描述任务

2.2.1聚类与分类的区别

分类是指分析数据仓库中的一组对象,找出其共同属性,然后根据分类模型把它们划分为不同的类别。举个简单的例子来说明:“公布考试成绩时,60分以上为及格和60分以下为不及格。”这里面的性质属性只有两个分类,及格和不及格,所有的成绩从这个属性来说,只能有这两种分类。

聚类分析与分类规则不同,它主要分析数据对象,而不考虑已知的类标记。一般情况,当只存在一个分类指标时,进行分类分析非常容易,然而,如果出现两个甚至多个分类指标,就需要考虑聚类分析。

聚类分析是不知要从何开始的,在聚类分析之前,要分成多少组,或者分成怎么样的组是未知的,包括区分规则,定义规则都是未知的。它是将一组物理或者抽象的对象按相似性归为若干类,其目的在于发现空间实体属性之间是否存在函数关系,是什么?并尽可能的利用变量的数学方程来表示。

第三章 对象

  3.1 数据挖掘的对象

    数据挖掘的范围非常广泛,既可以是单纯经济类或商业类的数字信息,也可以是社会科学或自然科学内容、科学处理产生的数据和卫星观测得到的任何数据。它们的数据结构各异,根据信息存储格式,用于挖掘的对象有关系数据库、事务数据库、数据仓库、文本数据源、多媒体数据库等。以下简要介绍几类数据挖掘对象的概念:

   (1)关系数据库

    大量元组存放于表之中,每个元组代表一个被唯一的关键字标识的对象,关系数据库是表的集合,每个表也都赋予一个唯一的名字而且包含一组属性。,关系数据可以通过数据库查询访问如SQL语言或者借助于图形用户界面书写。它是数据挖掘中最流行的、最丰富的数据源,也是数据挖掘研究的主要数据形式。

   (2)事务数据库 (Database Transaction) 

    一般地说,事务数据库由一个文件组成,其中每个记录代表一个事务,一个事务包含一个唯一的事务标识号和一个组成事务的项的列表。例如,在图书馆借阅的书籍,事务数据库可能有一些与之相关联的附加信息,包含关于书籍或者借阅者的其他信息:书籍的编号、借阅处理的日期、读者的会员ID、工作人员的工号等等。

   (3)数据仓库(Data Warehouse)

DW是一种独立存在的数据仓储,这种数据仓储并不影响其他已经运行的业务系统,它可以满足不同的数据存取、文档报告的需要。同时,数据仓库是一个面向主题的、集成的、不可更新的并且随时间变化的数据集合。

20181124142133116

第四章 数据挖掘的步骤及常用方法

  4.1数据挖掘的步骤

    数据挖掘过程中的步骤大体如下[13]:

(1)确定对象,定义需求:确定数据挖掘的目标,定义研究问题,了解该对象与需求的解决途径。

(2)数据准备:

①数据的选择:确定数据源,搜索收集所有与研究对象有关的内部数据以及外部数据信息,从中选择出适用于数据挖掘应用的数据。

    ②数据的预处理:研究数据的质量,列出数据库数据的属性、大小、格式,为进一步的分析作准备。确定将要进行的挖掘操作的类型,选择合适的挖掘工具和挖掘技术。

    ③数据的转换:根据知识发现的任务对经过预处理的数据进行再处理,针对挖掘算法将数据转换成一个分析函数。

   (3)数据挖掘:这是整个步骤中的核心阶段,运用算法,就之前经过转换的数据进行挖掘,并以一定的方式表示出来。

   (4)结果分析:解释并评估结果,与最初的研究目标比较,反馈给用户进行评价,通常可以利用各种可视化技术使结果更容易理解.

   (5)知识的同化:将分析所得到的知识集成到业务信息系统的组织结构中去,应用于实际的工作。数据挖掘的步骤如图所示:

 4.2 数据挖掘的常用方法

数据挖掘算法有很多种,这些挖掘算法有不同的技术特点,它们在数据挖掘系统中占有重要地位。在数据挖掘方法中,决策树、神经网络、粗糙集理论、模糊逻辑、进化计算和支持向量机等算法都显示了独特的优越性。

    1.遗传算法(GeneticA lgorithms)

    遗传算法是基于达尔文进化论中基因重组、突变和自然选择等概念作用于对某一种特定问题的一组可能的解法。利用繁殖和适者生存原理,组合最好的算法,抛弃较差的算法,做到取其精华去其糟粕,从而改善结果。

(全文略)

文章标题:《数据挖掘-医院业务数据分析》,原文地址:,如有转载请标明出处,谢谢。

上一篇:我国FDI区位选择影响因素实证分析


下一篇:基于虚拟化下的实验室设计与建设


[相关文章]