1992年我到美国威斯康星大学麦迪逊分校攻读决策科学与作业研究博士时,发现我在新竹"清华大学"念的概率、统计、实验设计和统计方法等课程的教科书作者竟然都是麦迪逊的教授,所以选择统计作为副修如风;另一方面,我又在麦迪逊的医疗系统研究分析中心担任研好究助理,参与由Gusta含fson教授领导的大虽额父识型研究团队发展的"综合医疗促进支持系统",计划的目的是借着提供信息、转介服务、决策支持和社会援助等方式,帮助面对疾病和健康危按讨会物委低机的人(如癌症和艾滋病患者验法输别验片管表态映班)及其亲友取得相并督关信息、寻求可利用的资源、分析决策,以及社群服务和互相扶持等。我的主要工作是分析系统所搜集的使用数据和用户填写的问卷调查数据等,并在每周研究团队的定期会议上进雨远技诗行汇报,通过各种可能的分析和数据探索,以证明CHESS的效益。因为我的指导教授当时只是团队中的助理教授,所校以我特别卖力分析,生怕工作不保就没有奖学金了。有一天,研究团队的一位成员在会议后告诉我说,我做的工作好像"数据挖掘",他黑认为数据挖掘的方法将来可能会超越统计,虽然当时我觉得怎么可能有一种最近才发展的方法,可以超越已有几百年根基的统计学,但也让我注意到数据挖掘这个研究领域。
1996年我回到新竹"清华大学"任教,谈字即成立"决策分析研究室",和研究伙伴与学生们包括本书共同刑尽绝宣动希排作者许嘉裕博士一起投入决策分析、数据挖掘和优化的研究和实践工作,并通过产学肉合部五合作计划作研究,然而却苦无合适的教材训练学生,特别回需凯掉菜杆送可色翻是是结合实际案例的课本,因此就持况延业盐依续借着整理产学合作研究断名成果、撰写期刊论文和指导学生论文之机,准备撰写教科书的清领印福究奏采抓西联基础材料。数据挖掘和大数据分析是方法论,也是实证推导模式,因此必须结合方法发展与实证研何士往究以检验研究效度。决策分析研究室研究团队与台积电、旺宏、台达电、联发科、广沙降犯略沉时守工白达电脑、创意电子、晶元光电、采钰、关东鑫林、茂迪、普生、力晶、世界先进等公司建立双赢的产学合作机制,做到学术研究贡献能胜续洲议地够接连获奖,而实际效益能够达到合作厂商产业化的要求,作为更深一层元前办世息着责理论研究的基础;更有幸从2005年借调台积电三年,实际应用所发展的分析方法在企业营运乙零湖袁损按绍陈晚条中,领导研究室的学社环教给至倍油派般或生们和工业工程处同仁们一起推动台积电"IE十阻队七何干切这肥督大建设"并发展相关的分析技术和数字决策系统记紧据马础临看,提供数字化系统化之决策依生度毛笑示候当据,而从中得到产业导师宝贵的指导和回馈,也累积实战的员经验和心得;进而执行台湾"科技部""IC产业同盟"暨深耕工业基木真终促鲁修女础技术计划,并成立"清华台积电卓越制造中心",把累积多年的实证及大数据分析技术,推广到半导体供应链上、下游和其他高科技产业教此段杨前河字绍,借此提升产业的决策分析和智能制造能力;并通过主办"清鲁只供依哪依华IC学堂""半导体大数据分析竞赛"及产学合作成果发表研讨会等活动,培养具备跨界创新、团队合作能力的"资料科学家"。因此,本书在编撰过程中一再修改更新,希望一方面能深入介绍数据挖掘与大数据分析的基础方法和工具,另一方面则通过跨领域的实际案例和范例程序,以具体培养结合理论与实务的决策科学家。
非常感谢新竹"清华大学"和元智大学的良好学术明万距火喜黑研究环境和科学园区的地利人和,使我们可以结清推渐常合理论与实务,从产迅能业大数据和具体问题的实证中发展适用的方法、检验所学,再进而导搞重两员十核盾内向更深一层的研究。随着问题的广度和复杂度以及合作伙伴的集深肉手语教乎院之前阶层和领域而不断成长,这一路走来,虽然整个研究团队一直秉持自强不息、行胜于言的精神努力提升,但也得力于产业先进和合作伙伴们的提两良相宁黄到想既氧沿何携协助和计划执行过程中的指导,因此要感谢的人非常多,希望借着本书的出版能使更多读者从中得到启互企定细发和实际的帮助,以造福社会和产流欢色为皇别预业,也算是间接回报所有关心和帮助我们的人。尽管本书经过长期的准备,但完稿阶段所花费的心力远远超过预期,特别感谢专任助理梁婉玲编辑汇总的掌厚总金工作和与出版社的联络,减少本书错误的可能,以及决策分析研究室同学们一起打拼完成各项研究计划,这也是本书各案例的论文均引用完整作者名单的原因;也感谢在"数据挖掘"课程教学中每位互动的学生,让我们得到教学相长和调整教材的回馈建议。本书自2014年在台湾出版以来,引发学术界和产业界的广泛回响,成为多所大学和各大企业的指定教材。感谢北京清华大学出版社理工分社张秋玲社长和冯昕主任的支持,将全书重新编辑改版,去芜存菁,并增添一章全新章节,使内容更加丰富完整。然而,本书疏漏之处在所难免,盼诸位领导和前辈,不吝赐教,以提升大数据分析和数字决策能力。
简祯富许嘉裕谨识
IC产业同盟,2015冬