進行數據分析當然要先有數據啦!
現在的數據已經不是只有單一結構化之數據而已,還有包含非結構化數據或混合多種形態之數據,在這一集,我們先瞭解一下常見之數據格式,並且學習如何將它們匯入,以作為後續數據分析之用。
第一步驟:確定數據格式
確認數據是以什麼格式存儲的。常見的格式:
結構化數據
:如CSV、Excel表格、JSON、XML等。
非結構化數據
:如純文本文件(TXT)、PDF、Word文檔(DOCX)等。
數據庫
:如SQL數據庫、NoSQL數據庫(MongoDB等)。
其他格式
:如HTML、日誌文件、圖像標註數據等。
首先,請Qwen幫你從網路上尋找並下載台積電股價之歷史資料。
提醒:向Qwen提出你的需求,若執行代碼後發現有報錯(Bug)或不滿意的地方,可以將Python之錯誤提示轉貼給Qwen,它會幫你分析報錯原因,並自動修正原先代碼,經過這種一來一往之問與答方式,直到執行出你理想中之結果為止。故上圖是經過幾次問與答後所得的。
代碼中,需要import一些套件,若本機沒有相關套件的話,需要先於終端機輸入以下代碼進行下載。
建議:Qwen除了幫我們撰寫PY代碼外,它還會針對代碼中之指令進行詳細說明,希望同學們閱讀與學習,經過一段時間學習後,針對代碼之小修改就可以自行完成,增加效率。