色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Python轉義字符的表示方法

python爬蟲知識分享 ? 來源:python爬蟲知識分享 ? 作者:python爬蟲知識分享 ? 2022-04-11 15:18 ? 次閱讀

1. 為什么要有轉義?

ASCII 表中一共有 128 個字符。這里面有我們非常熟悉的字母、數字、標點符號,都可以直接使用鍵盤輸入。除此之外,還有一些非常特殊的字符,這些字符,通常很難在鍵盤上的找到,比如制表符、響鈴這種。

為了能將那些特殊字符都能寫入到字符串變量中,就規定了一個用于轉義的字符 \ ,有了這個字符,你在字符串中看的字符,print 出來后就不一定是你原來看到的了。

舉個例子

>>> msg = "hello\013world\013hello\013python"
>>> print(msg)
hello
     world
          hello
               python

是不是有點神奇?變成階梯狀的輸出了。

那個 \013 又是什么意思呢?

\ 是轉義符號,上面已經說過

013 是 ASCII 編碼的八進制表示,注意前面是 0 且不可省略,而不是字母 o

把八進制的 13 轉成 10 進制后是 11

對照查看 ASCII 碼表,11 對應的是一個垂直定位符號,這就能解釋,為什么是階梯狀的輸出字符串。

2. 轉義字符的 5 種表示法

ASCII 有 128 個字符,如果用 八進制表示,至少得有三位數,才能將其全部表示。這就是為什么說上面的首位 0 不能省略的原因,即使現在用不上,我也得把它空出來。

而如果使用十六進制,只要兩位數就能把 ASCII 的字符全部表示出來。同時為了避免和八進制的混淆起來,所以在 \ 后面要加上英文字母 x 表示十六進制,后面再接兩位十六進制的數值。

\ 開頭并接三位 0-7 的數值,表示 8 進制

\x 開頭并接兩位 0-f 的數值,表示 16進制

因此,當我定義一個字符串的值為 hello + 回車 + world 時,就有了多種方法:

# 第一種方法:8進制
>>> msg = "hello\012world"
>>> print(msg)
hello
world

# 第二種方法:16 進制
>>> msg = "hello\x0aworld"
>>> print(msg)
hello
world

通常我們很難記得住一個字符的 ASCII 編號,即使真記住了,也要去轉換成八進制或者16進制,實在是太難了。

因此對于一些常用并且比較特殊字符,我們習慣用另一種類似別名的方式,比如使用 \n 表示換行,它與 \012 、\x0a 是等價的。

于是,要實現 hello + 回車 + world ,就有了第三種方法

# 第三種方法:使用類似別名的方法
>>> msg = "hello\nworld"
>>> print(msg)
hello
world

到目前為止,我們掌握了 三種轉義的表示法。

已經非常難得了,讓我們的腦洞再大一點吧,接下來再介紹兩種。

ASCII 碼表所能表示字符實在太有限了,想打印一個中文漢字,抱歉,你得借助 Unicode 碼。

Unicode 編碼由 4 個16進制數值組合而成

>>> print("\u4E2D")
中

什么?我為什么知道 的 unicode 是 \u4E2D?像下面這樣打印就知道啦

# Python 2.7
>>> a = u"中"
>>> a
u'\u4e2d'

由此,要實現 hello + 回車 + world ,就有了第四種方法。

# 第四種方法:使用 unicode ,\u000a 表示換行
>>> print('hello\u000aworld')
hello
world

看到這里,你是不是以為要結束啦?

不,還沒有。下面還有一種。

Unicode 編碼其實還可以由 8 個32進制數值組合而成,為了與前面的區分開來,這里用 \U 開頭。

# 第五種方法:使用 unicode ,\U0000000A 表示換行
>>> print('hello\U0000000Aworld')
hello
world

好啦,目前我們掌握了五種轉義的表示法。

總結一下:

\ 開頭并接三位 0-7 的數值(八進制) — 可以表示所有ASCII 字符

\x 開頭并接兩位 0-f 的數值(十六進制) — 可以表示所有ASCII 字符

\u 開頭并接四位 0-f 的數值(十六進制) — 可以表示所有 Unicode 字符

\U 開頭并接八位 0-f 的數值(三十二進制) — 可以表示所有 Unicode 字符

\ 開頭后接除 x、u、U 之外的特定字符 — 僅可表示部分字符

為什么標題說,轉義也可以炫技呢?

試想一下,假如你的同事,在打印日志時,使用這種 unicode 編碼,然后你在定位問題的時候使用這個關鍵詞去搜,卻發現什么都搜不到?這就撲街了。

雖然這種行為真的很 sb,但在某些人看來也許是非常牛逼的操作呢?

五種轉義的表示法到這里就介紹完成,接下來是更多轉義相關的內容,也是非常有意思的內容,有興趣的可以繼續往下看。

3. raw 字符串

當一個字符串中具有轉義的字符時,我們使用 print 打印后,正常情況下,輸出的不是我們原來在字符串中看到的那樣子。

那如果我們需要輸出 hello\nworld ,不希望 Python 將 \n 轉義成 換行符呢?

這種情況下,你可以在定義時將字符串定義成 raw 字符串,只要在字符串前面加個 r 或者 R 即可。

>>> print(r"hello\nworld")
hello\nworld
>>>
>>> print(R"hello\nworld")
hello\nworld

然而,不是所有時候都可以加 r 的,比如當你的字符串是由某個程序/函數返回給你的,而不是你自己生成的

# 假設這個是外來數據,返回 "hello\nworld"
>>> body = spider()
>>> print(body)
hello
world

這個時候打印它,\n 就是換行打印。

4. 使用 repr

對于上面那種無法使用 r 的情況,可以試一下 repr 來解決這個需求:

>>> body = repr(spider())
>>> print(body)
'hello\nworld'

經過 repr 函數的處理后,為讓 print 后的結果,接近字符串本身的樣子,它實際上做了兩件事

\ 變為了 \\

在字符串的首尾添加 ' 或者 "

你可以在 Python Shell 下敲入 變量 回車,就可以能看出端倪。

首尾是添加 ' 還是 " ,取決于你原字符串。

>>> body="hello\nworld"
>>> repr(body)
"'hello\\nworld'"
>>>
>>>
>>> body='hello\nworld'
>>> repr(body)
"'hello\\nworld'"

5. 使用 string_escape

如果你還在使用 Python 2 ,其實還可以使用另一種方法。

那就是使用 string.encode('string_escape') 的方法,它同樣可以達到 repr 的效果

>>> "hello\nworld".encode('string_escape')
'hello\\nworld'

6. 查看原生字符串

綜上,想查看原生字符串有兩種方法:

如果你在 Python Shell 交互模式下,那么敲擊變量回車

如果不在 Python Shell 交互模式下,可先使用 repr 處理一下,再使用 print 打印

>>> body="hello\nworld"
>>>
>>> body
'hello\nworld'
>>>
>>> print(repr(body))
'hello\nworld'

7. 恢復轉義:轉成原字符串

經過 repr 處理過或者 \\ 取消轉義過的字符串,有沒有辦法再回退出去,變成原先的有轉義的字符串呢?

答案是:有。

如果你使用 Python 2,可以這樣:

>>> body="hello\\nworld"
>>>
>>> body
'hello\\nworld'
>>>
>>> body.decode('string_escape')
'hello\nworld'

如果你使用 Python 3 ,可以這樣:

>>> body="hello\\nworld"
>>>
>>> body
'hello\\nworld'
>>>
>>> bytes(body, "utf-8").decode("unicode_escape")
'hello\nworld'

什么?還要區分 Python 2 和 Python 3?太麻煩了吧。

明哥教你用一種可以兼容 Python 2 和 Python 3 的寫法。

首先是在 Python 2 中的輸出

>>> import codecs
>>> body="hello\\nworld"
>>>
>>> codecs.decode(body, 'unicode_escape')
u'hello\nworld'

然后再看看 Python 3 中的輸出

>>> import codecs
>>> body="hello\\nworld"
>>>
>>> codecs.decode(body, 'unicode_escape')
'hello\nworld'

可以看到 Pyhton 2 中的輸出 有一個 u ,而 Python 3 的輸出沒有了 u,但無論如何 ,他們都取消了轉義。

以上,就是我為大家整理的關于 Python 中轉義的全部內容了,整理的過程,不斷的發現新知識,幫助到大家的同時,自己也對轉義的一些內容有了更深的理解。
審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • python
    +關注

    關注

    56

    文章

    4792

    瀏覽量

    84630
  • 轉義字符
    +關注

    關注

    0

    文章

    3

    瀏覽量

    752
收藏 人收藏

    評論

    相關推薦

    嵌入式學習-飛凌嵌入式ElfBoard ELF 1板卡-

    就是輸出一個提示信息,等待用戶按下ESC鍵后退出程序。 首先,為了程序美觀,我們定義變量a為一個轉義字符\"\\033\"。這個字符是ASCII碼中的轉義
    發表于 12-09 09:59

    飛凌嵌入式ElfBoard ELF 1板卡-提示程序之提示腳本continue.sh

    就是輸出一個提示信息,等待用戶按下ESC鍵后退出程序。首先,為了程序美觀,我們定義變量a為一個轉義字符\"\\033\"。這個字符是ASCII碼中的轉義
    發表于 12-07 08:52

    Python中dict支持多個key的方法

    ? 在Python中,字典(dict)是一種非常強大的數據結構,它允許我們通過鍵(key)來存儲和檢索值(value)。有時候,我們可能想要根據多個鍵來檢索或操作字典中的數據。雖然Python的字典
    的頭像 發表于 11-29 15:59 ?149次閱讀

    用于PCB設計的AM62Ax轉義路由

    電子發燒友網站提供《用于PCB設計的AM62Ax轉義路由.pdf》資料免費下載
    發表于 11-14 15:31 ?0次下載
    用于PCB設計的AM62Ax<b class='flag-5'>轉義</b>路由

    base64字符串轉換為二進制文件

    Base64是一種編碼方法,用于將二進制數據轉換為ASCII字符串。這種編碼通常用于在不支持二進制數據的系統中傳輸數據,例如電子郵件或網頁。將Base64字符串轉換為二進制文件的過程相對簡單,但需要
    的頭像 發表于 11-10 10:55 ?934次閱讀

    鴻蒙原生應用元服務開發-倉頡基礎數據類型字符類型

    字符類型使用 Rune 表示,可以表示 Unicode 字符集中的所有字符字符類型字面量
    發表于 09-19 10:58

    鴻蒙原生應用元服務開發-倉頡基礎數據類型字符串類型

    字符串類型使用 String 表示,用于表達文本數據,由一串 Unicode 字符組合而成。 字符串字面量 字符串字面量分為三類:單行
    發表于 09-18 10:43

    labview字符串如何轉換為16進制字符

    在LabVIEW中,將字符串轉換為16進制字符串是一個常見的需求,尤其是在處理數據通信和硬件接口時。LabVIEW提供了多種方法來實現這一轉換,包括使用內置函數、編寫VI(Virtual
    的頭像 發表于 09-04 15:54 ?2320次閱讀

    labview中如何實現字符串換行

    1. 字符串換行的基本概念 在LabVIEW中,字符串換行通常指的是在字符串中插入換行符,使得字符串在顯示或輸出時能夠自動換行。這在創建用戶界面或處理文本數據時非常有用。 2.
    的頭像 發表于 09-04 15:47 ?1622次閱讀

    labview字符串的四種表示各有什么特點

    。在LabVIEW中,字符串是一種基本的數據類型,用于表示文本信息。字符串在LabVIEW中有多種表示方式,每種方式都有其特定的應用場景和特點。以下是對LabVIEW中四種
    的頭像 發表于 09-04 15:40 ?542次閱讀

    如何實現Python復制文件操作

    Python 中有許多“開蓋即食”的模塊(比如 os,subprocess 和 shutil)以支持文件 I/O 操作。在這篇文章中,你將會看到一些用 Python 實現文件復制的特殊方法。下面我們開始學習這九種不同的
    的頭像 發表于 07-18 14:53 ?411次閱讀

    基于Python的深度學習人臉識別方法

    基于Python的深度學習人臉識別方法是一個涉及多個技術領域的復雜話題,包括計算機視覺、深度學習、以及圖像處理等。在這里,我將概述一個基本的流程,包括數據準備、模型選擇、訓練過程、以及測試與評估,并附上簡單的代碼示例。
    的頭像 發表于 07-14 11:52 ?1252次閱讀

    基于Python的地圖繪制教程

    本文將介紹通過Python繪制地形圖的方法,所需第三方Python相關模塊包括 rasterio、geopandas、cartopy 等,可通過 pip 等方式安裝。
    的頭像 發表于 02-26 09:53 ?1199次閱讀
    基于<b class='flag-5'>Python</b>的地圖繪制教程

    如何解決Python爬蟲中文亂碼問題?Python爬蟲中文亂碼的解決方法

    Python爬蟲中文亂碼問題。 一、了解字符編碼 在解決亂碼問題之前,我們首先需要了解一些基本的字符編碼知識。常見的字符編碼有ASCII、UTF-8和GBK等。 1. ASCII:是
    的頭像 發表于 01-12 15:11 ?2341次閱讀

    split在python中的用法

    split在python中的用法 split()是Python中一個非常常用的字符串函數,它能夠根據指定的分隔符將一個字符串分割成多個子字符
    的頭像 發表于 12-25 15:12 ?2018次閱讀
    主站蜘蛛池模板: 99在线观看视频| 含羞草传媒在线观看| 国内精品乱码卡一卡2卡三卡| 久久电影精品| 日本无码毛片一区二区手机看 | 两性午夜色视频免费网站| 欧美重口绿帽video| 亚洲国产韩国欧美在线不卡| 99久久国产综合精品国| 国产精品私人玩物在线观看| 老少配xxxxx欧美| 无码乱人伦一区二区亚洲一| 在线观看亚洲免费人成网址| 国产白丝精品爽爽久久蜜臀| 久久久久久人精品免费费看| 熟妇的味道HD中文字幕| 最近中文字幕2019国语4| 国产精品涩涩涩视频网站| 美女洗澡脱得一二干净| 亚洲成AV人片一区二区不卡| 99re热视频这里只有精品| 国模啪啪久久久久久久| 披黑人猛躁10次高潮| 亚洲宅男天堂a在线| 春药按摩人妻中文字幕| 久久伊人影院| 亚洲电影不卡| 第四色播日韩AV第一页| 美女大本营| 青柠在线电影高清免费观看| 人妻免费久久久久久久了| 男人叼女人| 最近中文字幕MV免费看| 99久久精品费精品国产| bl高h文合集| 国产成人无码WWW免费视频在线| 俄罗斯6一9泑女网站| 国产成人 免费观看| 国产成人亚洲精品无广告| 国产在线观看91精品| 久久大综合|