我想跟風談談 Tom Sung 在他的 Facebook 所寫的「數據分析師會走向泡沫化嗎?」一文:https://www.facebook.com/PoSheng.Sung/posts/pfbid024hgyGgUhy7nr6T3wWhFyJpxyrWacBb6TYngaEzEgPbjb76rYzuqkf9dDNfjSpBL1l
這份電子報的原文也同樣是寫在 Facebook:https://www.facebook.com/yaojen.kuo.1/posts/pfbid0uckYg3XERU9CSngKRubz7uw3ZQpaXrJjaKRGn3w9c9pSkFjhGgFZkVKuc9BkpY46l
許多朋友很喜歡我寫的文章,所以我將它寫成電子報寄給訂閱的讀者們。
緣起
很多從事資料相關工作的朋友、NTUDAC(台大資料分析社)的社員都有分享 Tom Sung 的這篇文章,我有觀察到部分還在觀望要不要投注資源的、或剛進入相關領域的人在閱讀了該文之後心中起了不小漣漪,我想給這樣的讀者一些鼓勵以及怎麼正面解讀這篇來自業界的第一手觀察。
檢視初衷的好時機
首先,對於想以數據分析師做為職涯起手式的讀者,在看到文章標題、「趨近飽和」、「市場對於分析師的需求真的沒那麼高」以及「所謂的Insight真的沒那麼多」等論述,難免感到一陣恐慌與挫折,不過你可以在這個時間點思量一下,究竟你是因為數據分析師的工作機會多而想從事,還是因為自己喜歡且擅長「使用程式與工具實踐資料科學場景來回答 OO 問題」,OO 可以帶入商業、投資或者財務等。假如是後者,請保持最大程度的樂觀,因為數據分析是內化在專業領域中的增強劑,換言之,只要組織不是盛行用 Gut feeling 或揣測上意來對待問題,就會有相應的舞台。
此一時彼一時
其次,不論在名片上印製的職稱是什麼,只要工作內容符合前段所云「使用程式與工具實踐資料科學場景來回答 OO 問題」,都可以廣泛稱之為數據團隊的成員,並不是所有的數據團隊都壁壘分明地區分職稱與工作職責。原文雖然沒有在職稱上有太多糾結,但是對於數據工程師、數據科學家沒有對應論述,難免讓讀者誤會僅有數據分析師會碰到泡沫化或過飽和的問題。如果允許我腦補,我想作者希望表達的是,多數開成數據分析師這個職稱下的缺其 Job hunting 的門檻是相對較低,如果沒有辦法在中後期茁壯自己的技能樹,比較容易在職涯發展上碰到瓶頸,譬如像是神鵰俠侶中描述歐陽鋒外功導向對比全真教內功導向,不過我們永遠可以討論個案,看看精美的楊過對比全真七子(誤);換言之,如果是一位能將自己的熱情與業務團隊需求、專業經理人 ad-hoc requests 對齊,對部門、組織收益成本充滿好奇的數據分析師,職涯發展天花板是很高的。反過頭來我們也能省思,如果是一位對於 DBA 或者後端開發不感興趣的資料工程師,或者是一位無法捋袖開發或者同理業務團隊需求的資料科學家,職涯發展天花板也可能是很低的。
一碗心靈雞湯
再來,要給受到「Insight 沒那麼多」論述挫折感的讀者心靈雞湯一碗,捫心自問「找出 OO 問題的 Insight/Finding」會是你工作中佔比多少的成就感來源?資料科學實踐的場景眾多,「7 成時間在做 Data Wrangling」對我們來說早已是老生常談,換言之如果有讀者把找 Insight 當作是成就感的主要來源,那問題可能來自對相關工作職務內容的認知不足。再者,如同原文中所強調對比 Insight/Finding 職場中更看重的是 Solution/Actionable item,假如不是砍掉重練或委託廠商的那種 Solution,而是耐著性子緩慢地陪業務團隊收斂、清點、排序、改正並測試,有些讀者可能覺得太撈過界,但若是呼應我們前段所云「能將自己的熱情與使用者需求、專業經理人 ad-hoc requests 對齊」,這會是甲方數據團隊比乙方顧問更具獨到價值之處;講得更極端一些,當來自業務團隊、專業經理人的需求如雪片般飛來之際,你還會很執著自己的工作能否找出 OO 問題的 Insight/Finding 嗎?
一劑強心針
結尾前,再給受到「Self service 是未來」論述打擊的讀者強心針一劑,怎麼說呢?私以為這點和「如果幾年後在 SQL 或 Python 上出現類似邏輯的工具」是讀者可以最低程度操心的部分。原文舉出了 Tableau 模式與眾多解決方案,這個部分可能讓讀者誤解業務團隊將會因為採用 Low code/No code 與 Business Intelligence 工具,而大幅減少對現行數據分析工具箱:SQL 與 Python/R(或者能實踐所有資料科學場景的任一個泛用程式語言、科學計算語言),那麼現在投注時間精力在學習這些東西豈不就白費了?主打圖形使用者介面(GUI)的 Low code/No code 解決方案早已行之有年,我舉兩個例子對照,前端工程師職缺有沒有因為 Front Page/Dream Weaver/Wix/Google Site 等解決方案的問世而下降?過去 10 年間資料科學蓬勃發展的盛世,Python/R/Julia 等能實踐所有資料科學場景的程式語言推廣和學習也在 SPSS/Weka/Rapidminer/Orange 等解決方案已經存在的前提下依舊高速成長。除了鑑往知來,現代資料科學採用程式語言包裝應用場景的理由其來有自,基於幾個相較 Low code/No code 與 Business Intelligence 工具的優勢:彈性、簡潔與開放性,功能愈高階使用起來固然愈簡單,但會犧牲客製程度;功能愈完整使用起來固然愈方便,但會犧牲可攜帶性與重製性;新功能的添加通常以季為單位釋放,不比社群如有機體般指數型成長的貢獻潛力。
毋免驚咱款款仔行
文末,我認為 Tom Sung 與我所寫的內容所面向的,應當是同質性高的一群人,大抵是還在觀望要不要投注資源的、或剛進入相關領域的人,原文點破一些不符現實的幻想泡泡,但可能戳得比較用力;我則是想鼓勵讀後有挫折感的讀者,希望你們藉這個機會思考一下,調整準備步伐,有三個建議可以參考。
持續專注基本功:商管、社科背景的學生選擇數據分析師作為切入點是有優勢的,但要切記絢麗的 Portfolio 可以讓你在面試脫穎而出、職涯起步得快,紮實的基本功能讓你的職涯走得更廣更深更穩。
避免文人相輕的態度:每個人都有自己喜歡的冰淇淋風味,這是一件好事,「鄙視鏈」的心態會讓想法激盪的可能性被限制,數據相關工作裡頭也可能會有,寫程式的看不起拉試算表的、寫物件導向的看不起寫 Procedural 的、懂演算法的看不起調參的,想想自己菜雞的時候,跟同儕又競爭又合作一起努力。
無法一步到位也沒關係:假如在職涯發展的過程中不能一步到位獲得自己引以為傲、喜歡且擅長的工作,也持續對自己保有更多的耐心,很多時候工作上需要一些運氣、緣份與人脈,並不是百分之百的實力決,多給自己一點時間,慢慢往自己喜歡的那個位置收斂就好。