华南俳烁实业有限公司

python

當(dāng)前位置:中華考試網(wǎng) >> python >> python編程基礎(chǔ) >> 文章內(nèi)容

Python數(shù)據(jù)挖掘怎么進(jìn)行預(yù)處理?

來源:中華考試網(wǎng)  [2020年11月13日]  【

  我們既然進(jìn)行數(shù)據(jù)挖掘,那就肯定和數(shù)據(jù)要做到一定關(guān)系,比如我們先要去了解數(shù)據(jù),在對數(shù)據(jù)進(jìn)行分析,然后處理等等,那這個過程是需要去操作實現(xiàn)的,我們在使用Python的時候要怎么去處理這些內(nèi)容呢?下面給大家整理了相關(guān)流程,讓大家可以快速處理數(shù)據(jù)。

  Python數(shù)據(jù)預(yù)處理實戰(zhàn)

  常見的數(shù)據(jù)預(yù)處理方法如下內(nèi)容:

  1、缺失值處理

  缺失值是指在一組數(shù)據(jù)中,某行數(shù)據(jù)缺失的某個特征值。

  2、異常值處理

  異常值產(chǎn)生的原因往往是數(shù)據(jù)在采集時發(fā)生了錯誤,如在采集數(shù)字68時發(fā)生了錯誤,誤將其采集成680。

  填寫下面表單即可預(yù)約申請免費試聽java課程!害怕學(xué)不會?助教全程陪讀,隨時解惑!擔(dān)心就業(yè)?一地學(xué)習(xí),可全國推薦就業(yè)!

預(yù)約申請免費聽java課程

  • 地區(qū):
  • 姓名:
  • 手機:

  3、數(shù)據(jù)集成

  相較于上文的缺失值處理和異常值處理,數(shù)據(jù)集成是一種較為簡單的數(shù)據(jù)預(yù)處理方式。

  接下來以淘寶商品數(shù)據(jù)為例,介紹一下上文預(yù)處理的實戰(zhàn)。

  在進(jìn)行數(shù)據(jù)預(yù)處理之前,首先需要從MySQL數(shù)據(jù)庫中導(dǎo)入淘寶商品數(shù)據(jù)。在開啟MySQL數(shù)據(jù)庫之后,對其中的taob表進(jìn)行查詢,得到了如下的輸出:

  可以看到,taob表中有四個字段。其中title字段用于存儲淘寶商品的名稱;link字段存儲淘寶商品的鏈接;price存儲淘寶商品的價格;comment存儲淘寶商品的評論數(shù)(一定程度上代表商品的銷量)。

  通過pymysql連接數(shù)據(jù)庫(如果出現(xiàn)亂碼,則對pymysql的源碼進(jìn)行修改),連接成功后,將taob中的數(shù)據(jù)全部檢索出來,然后借助pandas中的read_sql()方法便可以將數(shù)據(jù)導(dǎo)入到內(nèi)存中。

責(zé)編:fushihao

上一篇:Python3編碼如何實現(xiàn)文件操作?

下一篇: 沒有了

  • 會計考試
  • 建筑工程
  • 職業(yè)資格
  • 醫(yī)藥考試
  • 外語考試
  • 學(xué)歷考試
奎屯市| 库尔勒市| 来宾市| 宁津县| 阳泉市| 定远县| 千阳县| 陇川县| 远安县| 搜索| 福安市| 巴青县| 桃源县| 玛多县| 新巴尔虎右旗| 兴化市| 广东省| 奉贤区| 建瓯市| 东平县| 天全县| 通道| 朝阳区| 高尔夫| 漾濞| 神木县| 景洪市| 龙南县| 黑河市| 双城市| 西乌珠穆沁旗| 冀州市| 维西| 邵东县| 深泽县| 日照市| 乌鲁木齐县| 得荣县| 巴彦淖尔市| 炉霍县| 九寨沟县|