top of page
學習
一、 學習如何利用爬蟲抓資料
利用selenium模擬人點選網頁,再用BeautifulSoup來爬取資料並轉成csv檔,下圖是去抓取霓淨思化妝品公司在蝦皮上上架的商品。
二、學習如何利用QlikView來呈現資料
利用QlikView來視覺化呈現霓淨思在蝦皮上一、兩週的銷售表現,嘗試利用分布圖和圓餅圖來呈現價格分布,用長條圖來呈現前十高的銷售額和交易量成長,用折線圖呈現兩周的銷售量和交易金額的起伏。
利用列表框顯示各商品和金額給使用者點選,也能利用搜尋框搜尋商品。
三、 AutoEncoder基礎學習-圖片降噪練習
四、了解Bert相關知識
五、 專題主題思索過程
1. 以早餐店市場發展結合品牌評價的分析
沒有繼續的原因是連鎖早餐店的加盟金資料不易取得以及早餐店的評論數量不夠多。
2. 健康飲食規劃平台(與外送、醫療以及食譜供應結合)
沒有繼續的原因是這個平台要和許多供應商、外送平台等等合作,光是談合作就需要太多的流程和時間,雖然是個非常有前景的主題,但要在實習這段時間做出來是不太可能的。
3. 最終定案:影像辨識(yolov3+deepsort)
(1) OIDv4_Toolkit工具
這個工具是可以將google open images datasets v6的圖片和標記檔下載下來並將標記檔轉成yolo可使用的格式。
(2)Yolov4練習-測試和了解模型和變數(使用自己去台南拍的照片)
(3) 使用VOC模型- 測試原作者的code和資料集是否能順跑
(4) 根據VOC模型來更改變數並自己訓練模型
bottom of page