chicago = pd.read_csv("./csv/chicago.csv")

我們將使用 astype() 資料類型轉成 category ,這樣做為了減少記憶體使用的大小。

chicago["Department"] = chicago["Department"].astype("category")

我們顯示前十筆資料:

title()

chicago["Name"].title()

會發現得到錯誤:'Series' object has no attribute 'title'
因為Series裡面並沒有title這個方法,所以我們可以:

chicago["Name"].str.title()

這樣就可以讓資料使用title()這個方法了。

可以來看一下它是什麼資料類型:

type(chicago["Name"].str)

pandas.core.strings.StringMethods

接下來的方法也是一樣:

lower()

chicago["Name"].str.lower().head(3)

upper()

chicago["Name"].str.upper().head(3)

len()

chicago["Department"].str.len().head()

要更改資料很簡單:

chicago["Position Title"] = chicago["Position Title"].str.title()
chicago.head()

可以看到資料從原本都為大寫變成只有單字開頭為大寫的title格式了:

replace()

今天的最後呢,來說說replace()這個方法!
這是python內就有的用法:

"Hello world".replace("l","!")

會得到輸出 'He!!o wor!d'
這個方法呢是將()括弧內前面"l"的取代為後面的"!",現在來看看pandas怎麼做:

先匯入資料:

chicago = pd.read_csv("csv/chicago.csv").dropna(how="all")
chicago["Department"] = chicago["Department"].astype("category")
chicago.head(3)

來看看如何使用replace():

chicago["Department"] = chicago["Department"].str.replace("MGMNT","MANAGEMENT")

可以看到原本的 MGMNT 被取代成 MANAGEMENT 了!

那上半部就到這邊結束了,今天說明了python的字串處理在pandas內不能直接使用,需要先.str轉資料類型
最後,祝大家新年快樂啊!希望明年可以繼續撐下去啊~~~~~~(吶喊)