若你使用過 Shell 中的 awk 工具,會發現用它來分割字符串是非常方便的。特別是多個連續空格會被當做一個處理。
[root@localhost ~]# cat demo.txt
hello world
[root@localhost ~]#
[root@localhost ~]# awk '{print$1,$2}' demo.txt
hello world
可是轉換到 Python 上面來呢?結果可能是這樣的。
>> > msg='hello world'
>> > msg.split(' ')
['hello', '', '', '', 'world']
與我預想的結果不符,多個空格會被分割多次。
那有什么辦法可以達到 awk 一樣的效果呢?
有兩種方法。
第一種方法
不加參數,這種只適用于將多個空格當成一個空格處理,如果不是以空格為分隔符的場景,這種就不適用了。
>> > msg='hello world'
>> > msg.split()
['hello', 'world']
第二種方法
使用 filter 來輔助,這種適用于所有的分隔符,下面以 -
為分隔符來舉例。
>> > msg='hello----world'
>> > msg.split('-')
['hello', '', '', '', 'world']
> >>
>> > filter(None, msg.split('-'))
['hello', 'world']
是不是很神奇,filter 印象中第一個參數接收的是 函數,這里直接傳 None 居然有奇效。
查看了注釋,原來是這個函數會適配 None 的情況,當第一個參數是None的時候,返回第二個參數(可迭代對象)中非空的值,非常方便。
換用函數的寫法,可以這樣
>> > msg='hello----world'
>> > msg.split('-')
['hello', '', '', '', 'world']
> >>
>> > filter(lambda item: True if item else False, msg.split('-'))
['hello', 'world']
-
參數
+關注
關注
11文章
1859瀏覽量
32380 -
字符串
+關注
關注
1文章
585瀏覽量
20577 -
Shell
+關注
關注
1文章
366瀏覽量
23430
發布評論請先 登錄
相關推薦
評論