數據分析的風潮愈演愈烈!如何從大數據(Big Data)中獲得智慧已成為許多行業關注的議題,而在日常生活中,大數據的價值如何體現?本期電子報很榮幸邀請到系上康藝晃教授來與我們分享他與數據科學的相遇與數據分析的魅力。
在過去,無論是資料處理的方法、收集資料的速度、與資料儲存方式都受限於高昂的處理成本與設備費用。但由於現今資訊系統軟硬體技術的提升,高速網路的普及,以及雲端運算的快速發展。使得以前被視為不可能或不易蒐集的大量與複雜的資料可以在短時間內,以較低的成本被收集、處理、與分析。並從中找出許多現象或事物間非預期、有趣的關聯性。
老師以自己為例,提到資訊專業人員有無限的可能。在學期間,他曾受到許多師長的啟發,引導他如何將優秀的程式能力應用在數據科學的領域中,並將統計、數據分析與生活做連結。對老師來說,數據科學是一門「透過資料幫助人們發現與理解現象本質的方法」。而有趣的是,新的科技也會產生新的社會現象與問題,譬如社交網路與物聯網的產生大量過去無法輕易取得的資料,「應用數據分析來發現與解決問題永遠都不無聊!」。
老師從事公共衛生領域的研究已有一段時日,當時從事這份工作原先是為了支持在美國進修需要的生活費。老師選擇進入當地的醫學中心參與研究計畫,利用當地豐富的醫療保健與基因的資料庫,研究人們的背景、生活習慣、基因、與疾病間的關聯性。疾病的發生、藥物的使用都與日常生活息息相關。老師提到匹茲堡大學擁有全美數一數二龐大的醫療保健與基因資料庫,嚴謹的實驗分析輔以可觀數量的資料,讓研究者能夠證明基因、可能發生的疾病、以及適用藥物等之間的關聯性。隨著技術的進步與普及,除匹茲堡外,美國的其他地區也正如火如荼地展開相關研究,如知名網站「23andMe」讓大眾以99美金如此相對低廉的價格來檢驗自己的基因。民眾可依據獲得的檢驗結果,調整自己的生活作息、飲食習慣、運動偏好,或者將自己的基因資料提供給醫師作為診斷與用藥的輔助。而數據分析的技術,已經不只存在於研究人員的實驗室中。這些分析方法與工具已經免費並唾手可得。它們不但能促進人類的發展進步與產生商業價值,還能夠深入到一般民眾的日常作息,甚至提升我們的文化與生活品質。
老師也提到,數據分析的科學並非近幾年才出現,統計學家已經在這個領域深耕超過百年之久。而當現有的數據分析的方法遇上大數據時,「是問題,是機會,還是挑戰?」,「大數據給我們的是訊號還是噪音?」「是否資料量龐大即代表分析結果或找到的關聯具有可信度?」老師在下學期即將在碩士班開立大數據分析的基礎課程,手把手的帶領學生們認識數據分析,學習如何利用SAS、R、Python等程式語言及相關的工具實作數據分析,培養資訊管理人員在未來的工作領域需要的技能。「我受到許多貴人的指導,帶領我進入數據分析這個有趣的世界,如果我也能成為某個學生的貴人,教這門課就值得了!」老師的熱情你感受到了嗎?歡迎有興趣的同學們選修哦!
藝晃老師
|