C++的新標準又雙叒叕要到來了,是的,C++20要來了!
圖片來源:udemy.com
幾周前,C++標準委會歷史上規模最大的一次會議(180人參會)在美國San Diego召開,這次的會議上討論確定哪些特性要加入到C++20中,哪些特性可能加入到C++20中。在明年二月份的會議當中將正式確定所有的C++20特性。
這次會議討論的提案也是非常之多,達到了創紀錄的274份,C++20的新特性如果要一一列出的話將是一份長長的清單,因此本文將只評論大部分確定要加入和可能加入到C++20的重要特性,讓讀者對C++的未來和演進趨勢有一個基本的了解。
C++20中可能增加哪些重要特性,下面這個圖可以提供一個參考。
下面是本文將評論的將進入和可能進入C++20的重要特性:
Concepts
Ranges
Modules
Coroutines
Reflection
接下來讓我們慢慢揭開C++20的面紗,看看這些特性到底是什么樣的,它們解決了什么問題。
Concepts
在談Concepts之前我想先介紹一下Concepts提出的背景和原因。眾所周知,因為C++的模版和模版元具備非常強大的泛型抽象能力并且是zero overhead,所以模版在C++中備受推崇,大獲成功,在各種C++庫(如STL)中被廣泛使用。
然而,模版編程還存在一些問題,比如有些模版的代碼寫起來比較困難,讀起來比較難懂,尤其是編譯出錯的時候,那些糟糕的讓人摸不著頭腦的錯誤提示讓人頭疼。因此,C++之父Bjarne Stroustrup很早就希望對模版做一些改進,讓C++的模版編程變得簡單好寫,錯誤提示更明確。他早在1987年就開始做這方面的嘗試了。
C++之父Bjarne Stroustrup
具體思路就是給模版參數加一些約束,這些約束相比之前的寫法具有更強的表達能力和可讀性,會簡化C++的泛型模版代碼的編寫。
所以Concepts的出現主要是為了簡化泛型編程,一個Concept就是一個編譯期判斷,用于約束模版參數,Concepts則是這些編譯期判斷的合集。下面通過一個例子來展示Concepts是如何簡化模版編程的。
template
比如有這樣一個類B,我們調用它的成員函數tostring時,對T類型進行限定,即限定T類型是std::string的可轉換類型,這樣做的目的是為了更安全,能在編譯期就能檢查錯誤。這里通過C++14的std::enableif_t來對T進行限定,但是長長的enableift看起來比較冗長繁瑣,頭重腳輕。來看看用Concepts怎么寫這個代碼的。
template
可以看到,requires CastableToString比之前長長的enableift要簡潔不少,代碼可讀性也更好,CastableToString就是一個Concept,一個限定T為能被轉換為std::string類型的Concept,通過requires相連接,語義上也更明確了,而且這個Concept還可以復用。
Concepts的這個語法也可能在最終的C++20中有少許不同,有可能還會變得更簡潔,現在語法有幾個候選版本,還沒最終投票確定。
Ranges
相比STL,Ranges是更高一層的抽象,Ranges對STL做了改進,它是STL的下一代。為什么說Ranges是STL的未來?雖然STL在C++中提供的容器和算法備受推崇和廣泛被使用,但STL一直存在兩個問題:
STL強制你必須傳一個begin和end迭代器用來遍歷一個容器;
STL算法不方便組合在一起。
STL必須傳迭代器,這個迭代器僅僅是輔助你完成遍歷序列的技術細節,和我們的函數功能無關,大部分時候我們需要的是一個range,代表的是一個比迭代器更高層的抽象。
那么Ranges到底是什么呢?Ranges是一個引用元素序列的對象,在概念上類似于一對迭代器。這意味著所有的STL容器都是Ranges。在Ranges里我們不再傳迭代器了,而是傳range。比如下面的代碼:
STL寫法:
std::vector
Ranges寫法:
std::sort(v);
STL有時候不方便將一些算法組合在一起,來看一個例子:
std::vector
上面這個例子希望得到vector中的偶數乘以2的結果,需求很簡單,但是用STL寫起來還是有些冗長繁瑣,中間還定義了兩個臨時變量。如果用Ranges來實現這個需求,代碼就會簡單得多。
autoresults=v|ranges::view::filter([](inti){returni%2==0;})|ranges::view::transform([](inti){returni*2;});
用Concetps我們可以很方便地將算法組合在一起,寫法更簡單,語義更清晰,并且還可以實現延遲計算避免了中間的臨時變量,性能也會更好。
Concepts從設計上改進了之前STL的兩個問題,讓我們的容器和算法變得更加簡單好用,還容易組合。
Modules
一直以來C++一直通過引用頭文件方式使用庫,而其他90年代以后的語言比如Java、C#、Go等語言都是通過import包的方式來使用庫。現在C++決定改變這種情況了,在C++20中將引入Modules,它和Java、Go等語言的包的概念是類似的,直接通過import包來使用庫,再也看不到頭文件了。
為什么C++20不再希望使用#include方式了?因為使用頭文件方式存在不少問題,比如有include很多模版的頭文件將大大增加編譯時間,代碼生成物也會變大。而且引用頭文件方式不利于做一些C++庫和組件的管理工具,尤其是對于一些云環境和分布式環境下不方便管理,C++一直缺一個包管理工具,這也是C++被吐槽得很多的地方,現在C++20 Modules將改變這一切。
Modules在程序中的結構如下圖:
上面的圖中,每個方框表示一個翻譯單元,存放在一個文件里并且可以被獨立編譯。每個Module由Module接口和實現組成,接口只有一份,實現可以有多份。
Modules接口和實現的語法:
exportmodulemodule_name;modulemodule_name;
使用Modules:
importmodule_name;
Modules允許你導出類,函數,變量,常量和模版等等。
接下來看一個使用Modules的例子:
importstd.vector;//#include
可以看到不用再include了,直接去import需要用到的Modules即可,是不是有種似曾相識的感覺呢。曾看到一個人說如果C++支持了Modules他就會從Java回歸到C++,也說明這個特性也是非常受關注和期待的。
Coroutines
很多語言提供了Coroutine機制,因為Coroutine可以大大簡化異步網絡程序的編寫,現在C++20中也要加入協程了(樂觀估計C++20加入,悲觀估計在C++23中加入)。
如果不用協程,寫一個異步的網絡程序是不那么容易的,以boost.asio的異步網絡編程為例,我們需要注意的地方很多,比如異步事件完成的回調函數中需要保證調用對象仍然存在,如何構建異步回調鏈條等等,代碼比較復雜,而且出了問題也不容易調試。而協程給我們提供了對異步編程優雅而高效的抽象,讓異步編程變得簡單!
C++ Courotines中增加了三個新的關鍵字:co_await,co_yield和co_return,如果一個函數體中有這三個關鍵字之一就變成Coroutine了。
co_await用來掛起和恢復一個協程,co_return用來返回協程的結果,co_yield返回一個值并且掛起協程。
下面來看看如何使用它們。
寫一個lazy sequence:
generator
上面的例子每次調用get_integers,只返回一個整數,然后協程掛起,下次調用再返回一個整數,因此這個序列不是即時生成的,而是延遲生成的。
接下來再看一下co_wait是如何簡化異步網絡程序的編寫的:
chardata[1024];for(;;){std::size_tn=co_awaitsocket.async_read_some(boost::asio::buffer(data),token);co_awaitasync_write(socket,boost::asio::buffer(data,n),token);}
這個例子僅僅用了四行代碼就完成了異步的echo,非常簡潔!co_await會在異步讀完成之前掛起協程,在異步完成之后恢復協程繼續執行,執行到async_write時又會掛起協程直到異步寫完成,異步寫完成之后繼續異步讀,如此循環。如果不用協程代碼會比較繁瑣,需要像這樣寫:
voiddo_read(){autoself(shared_from_this());socket_.async_read_some(boost::asio::buffer(data_,max_length),[this,self](boost::system::error_codeec,std::size_tlength){if(!ec){do_write(length);}});}voiddo_write(std::size_tlength){autoself(shared_from_this());boost::asio::async_write(socket_,boost::asio::buffer(data_,length),[this,self](boost::system::error_codeec,std::size_t/*length*/){if(!ec){do_read();}});}
可以看到,不使用協程來寫異步代碼的話,需要構建異步的回調鏈,需要保持異步回調的安全性等等。而使用協程可以大大簡化異步網絡程序的編寫。
Reflection
C++中一直缺少反射功能,其他很多語言如Java、C#都具備運行期反射功能。反射可以用來做很多事情:比如做對象的序列化,把對象序列化為JSON、XML等格式,以及ORM中的實體映射,還有RPC遠程過程(方法)調用等,反射是應用程序中非常需要的基礎功能。現在C++終于要提供反射功能了,C++20中可會將反射作為實驗庫,在C++23中正式加入到標準中。
在反射還沒有進入到C++標準之前,有很多人做了一些編譯期反射的庫,比如purecpp社區開源的序列化引擎iguana,以及ORM庫ormpp,都是基于編譯期反射實現的。然后,非語言層面支持的反射庫存在種種不足之處,比如在實現上需要大量使用模版元和宏、不能訪問私有成員等問題。
現在C++終于要提供完備地編譯期反射功能了,為什么是編譯期反射而不是像其它語言一樣提供運行期反射,因為C++的一個重要設計哲學就是zero-overhead,編譯期反射效率遠高于運行期反射。
那么,通過C++20的編譯期反射我們能得到什么呢?我們可以得到很多很多關于類型和對象的元信息,主要有:
獲取對象類型或枚舉類型的成員變量,成員函數的類型;
獲取類型和成員的名稱;
獲取成員變量是靜態的還是constexpr;
獲取方法是virtual、public、protect還是private;
獲取類型定義時的源代碼所在的行和列。
所以C++20的反射其實是提供了一些可以編譯期向編譯器查詢目標類型“元數據”的API,下面來看看C++20的反射用法:
structperson{intid;std::stringname;};usingMetaPerson=reflexpr(person);usingMembers=std::reflect::get_data_members_t
上面的例子中,C++20新增關鍵字reflexpr返回的是person的元數據類型,接下來我們就可以查詢這個元數據類型了,std::reflect::getdatamembers_t返回的是對象成員的元數據序列,我們可以像訪問tuple一樣訪問這個序列,得到某一個字段的元數據之后我們就可以獲取它的具體信息了,比如它的具體類型是什么,它的字段名是什么,它是公有還是私有的等等。
注意:C++20的反射語法還沒有最終確定,這只是一種候選的語法實現,還有一種沒有元編程的語法版本,該版本通過編譯期容器和字符串來存放元數據,比如constexpr std::vector,constexpr std::map,constexprstd::string等 ,這樣就可以像普通的C++程序那樣來操作元數據了,用起來可能更簡單。
C++20的編譯期反射實際上提供了一些編譯期查詢AST信息的接口,功能完備而強大。
總結
Concepts讓C++的模版程序的編寫變得更簡單和容易理解;
Ranges讓我們使用STL容器和算法更加簡單,并且更容易組合算法及延遲計算;
Modules幫助我們大大加快編譯速度,同時彌補了C++使用庫和缺乏包管理的缺陷;
Coroutines幫助我們簡化異步程序的編寫;
Reflection給我們提供強大的編譯期AST元數據查詢能力;
......
關于C++20的更多細節讀者可以在這里查看:http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2018/。
總而言之,C++的新標準都是為了讓C++變得更簡單、更完善、更強大、更易學和使用,這也是C++之父希望未來C++演進的一個方向和目標。
C++20,一言以蔽之:Newer is Better!
在此呼吁現在仍然還在使用著20年前的標準C++98的公司盡早升級到最新的標準,跟上時代的發展,新標準意味這生產力和質量的提升,越早使用越早享受其帶來的好處!
-
編程
+關注
關注
88文章
3637瀏覽量
93900 -
C++
+關注
關注
22文章
2114瀏覽量
73780 -
代碼
+關注
關注
30文章
4820瀏覽量
68882
原文標題:C++20 準備來了,看看都有哪些新特性?
文章出處:【微信號:mcuworld,微信公眾號:嵌入式資訊精選】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論