色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Python工具pandas篩選數(shù)據(jù)的15個常用技巧

數(shù)據(jù)分析與開發(fā) ? 來源:數(shù)據(jù)分析與開發(fā) ? 作者:數(shù)據(jù)分析與開發(fā) ? 2021-03-30 10:44 ? 次閱讀

pandas是Python數(shù)據(jù)分析必備工具,它有強大的數(shù)據(jù)清洗能力,往往能用非常少的代碼實現(xiàn)較復雜的數(shù)據(jù)處理

今天,總結(jié)了pandas篩選數(shù)據(jù)的15個常用技巧,主要包括5個知識點:

比較運算:==、《、》、》=、《=、!=

范圍運算:between(left,right)

字符篩選:str.contains(pattern或字符串,na=False)

邏輯運算:&(與)、|(或)、not(取反)

比較函數(shù):eq, ne, le, lt, ge, gt(相當于==,=!,《=,《,》=,》)

apply和isin函數(shù)

”下面以超市運營數(shù)據(jù)為例,給大家逐個講解首先讀取數(shù)據(jù):

import pandas as pd

data=pd.read_excel(‘超市運營數(shù)據(jù)模板.xlsx’)

data

8820b96c-8e33-11eb-8b86-12bb97331649.png

先看一下各列的數(shù)據(jù)類型:

data.dtypes

商品ID int64

類別ID int64

門店編號 object

單價 float64

銷量 float64

訂單ID object

日期 datetime64[ns]

時間 object

dtype: object

下面以實際應(yīng)用場景為例開始講解:

1.篩選門店編號為‘CDXL’的運營數(shù)據(jù)①第一種方法,用比較運算符‘==’:

data[data.門店編號==‘CDXL’]

8bb1a37a-8e33-11eb-8b86-12bb97331649.png

②第二種方法,用比較函數(shù)‘eq’:

data[data[‘門店編號’].eq(‘CDXL’)]

8d57158e-8e33-11eb-8b86-12bb97331649.png

2.篩選單價小于等于10元的運營數(shù)據(jù)③第一種方法,用比較運算符‘《=’:

data[data.單價《=10]

90a6426e-8e33-11eb-8b86-12bb97331649.png

④第二種方法,用比較函數(shù)‘le’:

data[data[‘單價’].le(10)]

928adb4e-8e33-11eb-8b86-12bb97331649.png

3.篩選銷量大于2000的運營數(shù)據(jù)⑤第一種方法,用比較運算符‘》=’:

data[data.銷量》2]

92f569a0-8e33-11eb-8b86-12bb97331649.png

⑥第二種方法,用比較函數(shù)‘ge’:

data[data[‘銷量’].ge(2)]

92f569a0-8e33-11eb-8b86-12bb97331649.png

4.篩選除門店‘CDXL’外的運營數(shù)據(jù)⑦第一種方法,用比較運算符‘!=’:

data[data.門店編號!=‘CDXL’]

9345c238-8e33-11eb-8b86-12bb97331649.png

⑧第二種方法,用比較函數(shù)‘ne’:

data[data[‘門店編號’].ne(‘CDXL’)]

9397ac38-8e33-11eb-8b86-12bb97331649.png

5.篩選2020年5月的運營數(shù)據(jù)首先將日期格式化:

data[‘日期’]=data[“日期”].values.astype(‘datetime64’) #如果已為日期格式則此步驟可省略

data[‘日期’]

import datetime

s_date = datetime.datetime.strptime(‘2020-04-30’, ‘%Y-%m-%d’).date() #起始日期

e_date = datetime.datetime.strptime(‘2020-06-01’, ‘%Y-%m-%d’).date() #結(jié)束日期

⑨第一種方法,用邏輯運算符號‘》’ ‘《’和‘&’:

Pandasdatetime64[ns]不能直接與datetime.date相比,需要用pd.Timestamp進行轉(zhuǎn)化

data[(data.日期》pd.Timestamp(s_date))&(data.日期《pd.Timestamp(e_date))]

93dc75ca-8e33-11eb-8b86-12bb97331649.png

⑩第二種,用比較函數(shù)‘gt’‘lt’和‘&’:

data[(data[‘日期’].lt(pd.Timestamp(e_date)))&(data[‘日期’].gt(pd.Timestamp(s_date)))]

94be8c4e-8e33-11eb-8b86-12bb97331649.png

?第三種,用apply函數(shù)實現(xiàn):

id_a=data.日期.apply(lambda x: x.year ==2020 and x.month==5)

data[id_a]

950240e2-8e33-11eb-8b86-12bb97331649.png

?第四種,用between函數(shù)實現(xiàn):

id_b=data.日期.between(pd.Timestamp(s_date),pd.Timestamp(e_date))

data[id_b]

953ad6f0-8e33-11eb-8b86-12bb97331649.png

6.篩選“類別ID”包含‘000’的數(shù)據(jù)?第一種,用contains函數(shù):

data[‘類別ID’]=data[‘類別ID’].values.astype(‘str’) #將該列轉(zhuǎn)換為字符數(shù)據(jù)類型

id_c=data.類別ID.str.contains(‘000’,na=False)

data[id_c]

95c1ec76-8e33-11eb-8b86-12bb97331649.png

?第二種,用isin函數(shù):

id_i=data.類別ID.isin([‘000’]) #接受一個列表

data[id_i]

很遺憾,isin函數(shù)搞不定,因為它只能判斷該列中元素是否在列表中

7.篩選商品ID以“301”開頭的運營數(shù)據(jù)?需要用contains函數(shù)結(jié)合正則表達式使用:

data[‘商品ID’]=data[‘商品ID’].values.astype(‘str’) #將該列轉(zhuǎn)換為字符數(shù)據(jù)類型

id_c2=data.商品ID.str.contains(‘301d{5}’,na=False)

data[id_c2]

95c1ec76-8e33-11eb-8b86-12bb97331649.png

為了方便大家學習,我已經(jīng)將本文數(shù)據(jù)及代碼打包好,請關(guān)注 數(shù)據(jù)分析與開發(fā) 公眾號在后臺回復關(guān)鍵字:篩選數(shù)據(jù) 獲取。

原文標題:一次性總結(jié)了pandas提取數(shù)據(jù)的15種方法,統(tǒng)統(tǒng)只需1行代碼!

文章出處:【微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1452

    瀏覽量

    34076
  • python
    +關(guān)注

    關(guān)注

    56

    文章

    4799

    瀏覽量

    84810

原文標題:一次性總結(jié)了pandas提取數(shù)據(jù)的15種方法,統(tǒng)統(tǒng)只需1行代碼!

文章出處:【微信號:DBDevs,微信公眾號:數(shù)據(jù)分析與開發(fā)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    如何進行元器件篩選

    電子元件的核心作用在電子設(shè)備中,電子元件扮演著基礎(chǔ)而關(guān)鍵的角色,它們是電子通信、數(shù)據(jù)處理和自動化控制等技術(shù)領(lǐng)域的基石。篩選的必要性為了確保電子元件在其整個使用壽命內(nèi)都能穩(wěn)定工作,避免因元件本身的缺陷
    的頭像 發(fā)表于 12-19 12:37 ?184次閱讀
    如何進行元器件<b class='flag-5'>篩選</b>?

    Kaggle知識點:使用大模型進行特征篩選

    數(shù)據(jù)科學數(shù)據(jù)挖掘的核心是是對海量數(shù)據(jù)進行有效的篩選和分析。傳統(tǒng)上數(shù)據(jù)篩選依賴于
    的頭像 發(fā)表于 12-03 01:06 ?1264次閱讀
    Kaggle知識點:使用大模型進行特征<b class='flag-5'>篩選</b>

    如何使用Python構(gòu)建LSTM神經(jīng)網(wǎng)絡(luò)模型

    numpy tensorflow 2. 準備數(shù)據(jù) LSTM模型通常用于序列數(shù)據(jù),比如時間序列預測或文本生成。這里我們以一簡單的時間序列預測為例。假
    的頭像 發(fā)表于 11-13 10:10 ?439次閱讀

    Python常用函數(shù)大全

    Python 世界里,有一些寶藏函數(shù)和模塊,它們可以讓你編程更輕松、代碼更高效。這篇文章將帶你一一認識這些神器,讓你的開發(fā)生活瞬間輕松不少!
    的頭像 發(fā)表于 10-27 17:20 ?287次閱讀

    使用Python進行Ping測試

    在網(wǎng)絡(luò)工程中,Ping測試是一種常用的網(wǎng)絡(luò)診斷工具,用于檢查網(wǎng)絡(luò)連接的可達性和響應(yīng)時間。Ping測試通過向目標主機發(fā)送ICMP(Internet Control Message Protocol
    的頭像 發(fā)表于 08-12 17:56 ?540次閱讀
    使用<b class='flag-5'>Python</b>進行Ping測試

    Python建模算法與應(yīng)用

    Python作為一種功能強大、免費、開源且面向?qū)ο蟮木幊陶Z言,在科學計算、數(shù)學建模、數(shù)據(jù)分析等領(lǐng)域展現(xiàn)出了卓越的性能。其簡潔的語法、對動態(tài)輸入的支持以及解釋性語言的本質(zhì),使得Python在多個平臺
    的頭像 發(fā)表于 07-24 10:41 ?579次閱讀

    數(shù)據(jù)分析的工具有哪些

    數(shù)據(jù)分析是一涉及收集、處理、分析和解釋數(shù)據(jù)以得出有意義見解的過程。在這個過程中,使用正確的工具至關(guān)重要。以下是一些主要的數(shù)據(jù)分析
    的頭像 發(fā)表于 07-05 14:54 ?889次閱讀

    深度學習常用Python

    深度學習常用Python庫,包括核心庫、可視化工具、深度學習框架、自然語言處理庫以及數(shù)據(jù)抓取庫等,并詳細分析它們的功能和優(yōu)勢。
    的頭像 發(fā)表于 07-03 16:04 ?668次閱讀

    常見的數(shù)據(jù)采集工具的介紹

    Scraping) 網(wǎng)絡(luò)爬蟲是一種自動化的程序,用于從互聯(lián)網(wǎng)上提取信息。它們可以訪問網(wǎng)頁,解析HTML內(nèi)容,并從中提取所需的數(shù)據(jù)。 Scrapy : 一快速且強大的Python框架,用于抓取網(wǎng)站
    的頭像 發(fā)表于 07-01 14:51 ?879次閱讀

    請問如何修改工程對應(yīng)的IDF工具的位置?

    :\\Espressif\\frameworks\\esp-idf-v4.4.2目錄下尋找工具。請問該如何修改可以去新的目錄下尋找新的工具? Code: Select all C
    發(fā)表于 06-06 08:17

    Python怎么讀取STM32串口數(shù)據(jù)

    我用Python寫的一串口讀取代碼 :import serial import timeser=serial.Serial(\'com5\',9600,timeout=2)s
    發(fā)表于 04-24 07:30

    mapgis屬性篩選表達式

    MapGIS是一種廣泛應(yīng)用于地理信息系統(tǒng)(GIS)領(lǐng)域的軟件平臺。它提供了多種功能和工具,用于處理和分析地理數(shù)據(jù)。屬性篩選是MapGIS中一項重要的功能,它允許用戶根據(jù)特定的屬性條件來篩選
    的頭像 發(fā)表于 02-25 10:58 ?1677次閱讀

    如何使用linux下gdb來調(diào)試python程序

    如何使用linux下gdb來調(diào)試python程序? 在Linux下,可以使用GDB(GNU調(diào)試器)來調(diào)試Python程序。GDB是一強大的調(diào)試工具,可以幫助開發(fā)者診斷和修復程序中的錯
    的頭像 發(fā)表于 01-31 10:41 ?2662次閱讀

    eda工具軟件有哪些 EDA工具有什么優(yōu)勢

    和預測提供基礎(chǔ)。在進行EDA過程中,使用合適的工具軟件可以顯著提升效率和準確性。本文將介紹幾種常見的EDA工具軟件。 Python和其相關(guān)的庫 Python是一種廣泛使用的編程語言,擁
    的頭像 發(fā)表于 01-30 13:57 ?1179次閱讀

    小米電腦數(shù)據(jù)恢復的常用方法、工具和步驟

    在現(xiàn)代數(shù)字化時代,電腦已成為我們生活和工作中必不可少的工具之一。然而,有時我們可能會遇到數(shù)據(jù)丟失的情況,這可能是因為誤刪、磁盤故障、操作系統(tǒng)崩潰等原因?qū)е隆1疚膶⒃敿毥榻B小米電腦數(shù)據(jù)恢復的常用
    的頭像 發(fā)表于 01-25 11:10 ?2331次閱讀
    主站蜘蛛池模板: 果冻传媒2021精品在线观看| 亚洲成人网导航| 日本片bbbxxx| 国产一卡2卡3卡4卡孕妇网站 | 最新无码国产在线视频| 国产AV无码一二三区视频| 美女被艹网站| 性欧美video另类hd高清| jizzhd中国| 成人精品视频99在线观看免费| 国产一区亚洲| 日本二区三区欧美亚洲国| 在线高清电影理论片4399| 国产精品久久久久婷婷五月色婷婷| 男人j进女人j一进一出| 日本午夜精品理论片A级APP发布| 夜里18款禁用的免费B站动漫| 99久久国产极品蜜臀AV酒店| 果冻传媒在线完整免费播放| 日本888xxxx| 777ZYZ玖玖资源站最稳定网址| 国内精品视频在线播放一区 | 蜜芽丅v新网站在线观看| 日产日韩亚洲欧美综合搜索| 2020国产成人精品视频人| 澳大利亚剧满足在线观看| 久久久久综合网| 亚洲高清视频在线观看| 动漫护士被乳羞羞漫| 欧美另类摘花hd| 最新毛片网| 久久国产乱子伦精品免费M| 迅雷成人论坛| 国产白浆视频在线播放| 秋霞电影网午夜鲁丝片| 亚洲人视频在线| 啊灬啊灬啊灬快高潮视频| 玛雅成人网| 一级片mp4| 二次元美女扒开内裤喷水| 久久精品国产只有精品|