慢慢變強,克服程式設計與資料分析的學習焦慮

慢慢來比較快

Peter Norvig(美國電腦科學家,現為 Google 研究總監)曾寫過一篇文章「Teach Yourself Programming in Ten Years」,提到書店陳列著以 24 個小時、7 天或者 4 週學會某個程式語言、主打高速學習訴求的技術書籍;而強調快速高校率的思維,在職涯發展、商業模式與投資致富等領域也比比皆是,這或許是我們常注意到檯面上的爆紅,卻忽略上台前經年累月的累積;披頭四樂團看似在 1964 年於 The Ed Sullivan Show 一夕成名,實際上卻早從 1957 年就開始在英國利物浦和德國漢堡的各個小型俱樂部日以繼夜演出。

現代資料科學

資料科學的應用範疇涵蓋程式設計、獲取載入、整併轉換、摘要探索以及分析預測,常用一種類似管線的結構來描述由左至右的資料流,每個環節小則一個函式的呼叫,大則一個系統的建置。

圖片來源:https://r4ds.had.co.nz/

在短期雖然竭盡全力也僅能略懂單一環節的二三事,但這並無損於長期我們期待有朝一日站上具備架構師、軟體工程師、統計學家與商業分析師在資料科學領域交會點的胸懷大志。

數據交點試圖描繪出那個看似遙不可及的交會點座標,定期撰寫聚焦於程式設計與資料分析的原創文章,和讀者一起透過文字、程式碼與雲端環境,向那個交會點更靠近一些,即便縮短的距離僅是一個微小值 Epsilon 依然無悔前行。

  1. 口語化的敘述:我不會使用抽象的辭彙,像是生成式、裝飾器或遞迴等這種難以理解的字詞,假若萬不得已,將會用多個範例來釋義。

  2. 生活中的小事:我不會使用像是 foo() 、bar()、dog.bark() 或 cat.meow() 這種廣受軟體工程師明暸卻容易讓人困惑的範例,而是用貼近生活的二三事來寫範例。

  3. 瀏覽器的環境:我會使用 BinderHub、 JupyterHub 與 nbgitpuller 等容器技術,預先建置好只要有網路與瀏覽器就可以互動執行的雲端環境。

毋免驚,咱寬寬仔行

我會在數據交點文摘撰寫精簡的短篇文章,利用生活範例講述資料、分析與程式的綜合應用,搭配可以直接在瀏覽器上執行的環境,透過 Substack 寄送給訂閱者。我的核心價值是提供小而美的內容服務,而不是找尋譁眾取寵的題材來衝高訂閱者。我也深信不論多麽小眾的興趣、多麽怪異的風格或者多麽冷門的題材,一定可以找到志同道合的愛好者,如同 Wired 雜誌創刊主編 Kevin Kelly 在 1,000 True Fans 所描述的那個美好願景。

主編/作者:郭耀仁

我是郭耀仁,2010 年自台大商研所畢業,數據交點文摘的主編與作者。我是台大工商管理學系的兼任講師,自 2020 起每個學年的春季班開設三學分「視覺化與現代資料科學」選修課程;台灣師範大學企管學系的兼任講師,自 2020 起每個學年的秋季班開設三學分「商業分析程式語言」選修課程;在台大資工系統訓練班、資策會與中華電信學院講授資料科學課程,曾受邀至玉山銀行、華南銀行與星展銀行進行資料科學工作坊。在專業講師之前任職過電商資料分析師、軟體公司資料分析顧問、銀行儲備幹部與管理顧問公司實習生,閒暇時喜歡長跑(最好的馬拉松成績是 2 小時 43 分)。

若想更認識我一些,可以參考我的 Hahow 好學校線上課程、著作還有部落格:

  1. 如何成為資料分析師

  2. 新手村逃脫!初心者的 Python 機器學習攻略

  3. 進擊的資料科學

  4. 輕鬆學習 R 語言

  5. Medium 部落格

問與答

數據交點文摘有付費訂閱方案嗎?

有的。要穩定製作有品質、有價值的內容必須要專注投入精神與時間,數據交點文摘所有內容都由我原創製作,不放置任何聯盟行銷連結,亦不會刊登置入性行銷業配文;因此付費訂閱讀者將是最強而有力也是唯一的後盾,我也會將提供小而美的內容服務奉為核心價值,努力實踐。

數據交點文摘提供哪些加值服務給付費訂閱讀者?

  1. 專屬個人的線上免安裝程式設計環境。付費訂閱讀者能夠使用我所維護的 JupyterHub,在 JupyterHub 中所新增的筆記本與程式碼能夠被保存,僅有付費訂閱讀者與我能檢視,並針對所遭遇到的問題討論、註解。

  2. 直接練習且可即時批改回饋的實作題。付費訂閱讀者能夠「一鍵複製」我所設計的實作題到專屬個人的程式設計環境,完成習題之後能夠執行單元測試即時批改,加強學習效果。

  3. 多種程式語言與框架映像檔可供選擇。付費訂閱讀者能夠使用

    1. Data science environment 學習 Python、R 與 Julia

    2. Spark environment 學習 Scala 與 Spark

    3. Xeus environment 學習 C 與 C++

    4. SageMath environment 學習科學計算

    5. TensorFlow environment 學習 TensorFlow 與 Keras

    6. IJavascript environment 學習 JavaScript 與 TypeScript