从零构建基于 C++20 的 Task
-
C++20 引入了无栈协程(Stackless Coroutines)的核心语言机制,但与之相配套的标准库高级抽象(如
std::task)并未同步提供。在构建基于io_uring或epoll的高性能并发框架时,我们不可避免地需要自行设计一个用于封装异步操作的返回类型:Task<T>。设计这样一个任务类型,不仅仅是对新关键字的语法包装,其本质是在解决两个系统级编程的核心问题:
- 控制流的无缝路由
- 堆分配状态帧的确定性释放。
本文将探讨如何从零构建一个可用的Task<T>。
1. 异步组合的困境与懒启动(Lazy Evaluation)
在传统的同步流中,函数的调用即意味着执行的开始。但在异步架构中,任务的“构造”与“执行”往往需要被严格分离。
为了建立直观的理解,我们可以先参考 Python 中的协程行为。在 Python 中,调用一个
async def函数并不会立即执行其内部代码,而是仅仅返回一个协程对象:import asyncio async def fetch_data(): print("开始发起网络请求...") # ... # 此时并不会打印任何内容,仅仅是构造了一个任务对象 task = fetch_data() # 只有显式地等待或交给事件循环,代码才会真正运转 # await task这种机制被称为懒启动(Lazy Evaluation)。如果我们允许 C++ 的协程在被调用时立即开始执行(即所谓的 Eager Evaluation),它可能会在尚未正确挂载到事件循环(Event Loop)之前,就过早地触发了底层的 I/O 投递操作。这不仅破坏了状态的封装,还极易引发复杂的竞态条件。
因此,一个健壮的 C++
Task<T>必须是懒启动的。这在 C++20 中是通过定制promise_type的初始化行为来实现的:class promise_type { public: // 协程帧创建后立即挂起,不主动执行协程体代码 auto initial_suspend() noexcept -> std::suspend_always { return {}; } // ... };通过返回
std::suspend_always,协程在完成内部状态帧的堆分配后会立刻交出控制权。这种设计使得异步任务可以像普通的数据结构一样被安全地传递、存储和组合,直到调用者显式地通过co_await来驱动它。2. 协程间的控制流移交
异步操作很少是孤立存在的。当父协程执行
co_await child_task;时,当前的执行流必须被挂起,并将 CPU 的控制权移交给子协程。同时,子协程必须知晓在自身执行完毕后,应该唤醒哪一个调用者。为了建立这种调用链,我们利用了
co_await运算符所触发的编译器协议。在 C++20 中,
co_await并非一个简单的挂起指令,而是一个可定制的控制流拦截点。当编译器遇到co_await <expr>时,它会要求<expr>产出一个符合特定接口的Awaiter对象,并依次调用其三个核心方法:await_ready():探测状态。询问异步操作是否已经完成。如果返回true,编译器将走“快速通道”,直接跳过挂起阶段;如果返回false,则准备挂起当前协程。await_suspend(std::coroutine_handle<>):核心拦截点。在当前协程的物理状态(寄存器、局部变量)被安全保存到堆上的协程帧后,编译器会调用此方法,并将当前(父)协程的句柄作为参数传入。await_resume():结果提取点。当协程被再次唤醒时,此方法的返回值将作为整个co_await表达式的结果。
基于这一协议,我们在
Task内部定义了专门的Awaiter,以此来接管并路由控制流:class Awaiter { public: explicit Awaiter(handle_type handle) : handle_{ handle } {} // 1. 探测状态:如果子协程尚未执行完毕,则强制父协程挂起 bool await_ready() const noexcept { return !handle_ || handle_.done(); } // 2. 挂起时的控制流路由 auto await_suspend(std::coroutine_handle<> next) -> std::coroutine_handle<> { // 将父协程的句柄 (next) 记录在子协程的 promise 状态中 handle_.promise().next = next; // 返回子协程的句柄,指示 C++ 运行时将执行流切换至子协程 return handle_; } // 3. 唤醒后的结果提取 auto await_resume() const -> T { if (!handle_) throw std::logic_error{ "Invalid handle" }; return handle_.promise().result(); } private: handle_type handle_; // 子协程的句柄 };通过这一套状态机转换,C++ 将底层的调度权完全下放给了库作者。
在
await_suspend执行的瞬间,父协程已被安全冻结。我们将其句柄保存在子协程的
promise_type::next字段里,从而在内存中建立了一个单向的调用链表(父 -> 子)。紧接着返回子协程的
handle_,运行时会直接跳转执行子协程代码,实现了零开销的上下文切换。3. 栈溢出风险与对称传输(Symmetric Transfer)
子协程执行到末尾(或遇到
co_return)时,需要唤醒之前等待它的父协程。这往往是自定义协程实现中最容易出错的环节。直觉上的做法是,在子协程的收尾阶段直接调用
next.resume()。然而,这种非对称传输(Asymmetric Transfer)存在致命缺陷:resume()本质上是一个常规的同步函数调用。在网络服务这类存在深层嵌套或无限循环挂起的场景中(例如
while(true) { co_await read(); }),每一次resume()都会在操作系统的线程栈上压入一个新的栈帧。调用链越长,栈越深,最终必然导致 Stack Overflow(栈溢出)。为了提供工业级的稳定性,
Task在收尾时必须采用对称传输(Symmetric Transfer):class FinalAwaiter { public: bool await_ready() const noexcept { return false; } template<typename Promise> auto await_suspend(std::coroutine_handle<Promise> handle) const noexcept -> std::coroutine_handle<> { auto next = handle.promise().next; // 关键点:直接返回父协程的句柄,而非调用 next.resume() return next ? next : std::noop_coroutine(); } void await_resume() const noexcept {} }; // 在 promise_type 中指定收尾行为: auto final_suspend() noexcept -> FinalAwaiter { return {}; }通过让
final_suspend返回一个包含父协程句柄的Awaiter,编译器会采用类似尾调用优化(Tail Call)的机制:它会首先将当前子协程的物理栈帧安全剥离,然后再以平级跳转的方式进入父协程。
在这种机制的保障下,无论业务逻辑中
co_await嵌套了多少层,底层的线程调用栈深度始终保持恒定 (O(1))。4. 返回值的提取与异常路由
异步任务不仅涉及控制流的跳转,还必须安全地跨越挂起边界传递数据或异常,并且表现得如同普通的 C++ 函数调用一样。
在子协程内部,产生的值或未捕获的异常被分别存储在
promise_type的std::optional<T>和std::exception_ptr中。当父协程通过对称传输被唤醒,并执行await_resume()时,需要提取这些结果:auto result() -> T { if (exception_) std::rethrow_exception(exception_); return std::move(value_).value(); }这里包含两个重要的设计约束:
- 异常透明性:
std::rethrow_exception确保了子协程中发生的异常能够被无缝抛出,并被父协程的try-catch块捕获,维持了 C++ 异常处理语义的连贯性。 - 资源所有权转移:通过
std::move提取值,保证了诸如std::unique_ptr或封装了系统资源(如文件描述符)的不可拷贝对象(Move-Only Types)能够被正确返回。
5. 协程帧的生命周期管理与单次消费语义
无栈协程的局部变量和
promise_type被编译器分配在堆上的协程帧(Coroutine Frame)中。由于 C++ 没有垃圾回收机制,资源泄漏是协程编程中的主要风险之一。依据 C++ 核心的 RAII(资源获取即初始化)原则,
Task对象作为协程句柄的唯一持有者,理应负责这块内存的清理:template<typename T> class Task { public: ~Task() { if (handle_) handle_.destroy(); } // 限制为右值调用,且不转移 handle_ 的所有权 auto operator co_await() && noexcept { return Awaiter{ handle_ }; } };这里有两个深思熟虑的设计权衡:
第一:为什么限制
operator co_await为右值版本(&&)?
协程代表一个异步计算过程,其内部结果(特别是前文提到的 Move-Only 类型)在await_resume中是被破坏性提取的(std::move)。这意味着一个Task在逻辑上只能被消费一次。如果允许对左值的Task进行co_await,调用者可能会意外地多次等待同一个任务:Task<int> t = do_work(); auto res1 = co_await t; auto res2 = co_await t; // 错误:底层协程已经结束,状态帧已被销毁通过添加
&&限定符,我们利用 C++ 的类型系统在编译期强制执行了“单次消费(Single-Shot)”语义。调用者必须直接等待临时对象(如co_await do_work();),或者显式地转移所有权(co_await std::move(t);)。这在接口层面明确了状态机的生命周期契约。第二:为什么在右值版本中,依然不剥夺 Task 的所有权?
通常在处理右值时,我们会使用std::exchange来转移底层资源。但在这里,我们仅向Awaiter传递了句柄的值。
当执行auto res = co_await do_work();时,do_work()产生的Task临时对象的生命周期会被编译器自动延续,直到整个co_await表达式求值完毕(即await_resume()返回之后)。此时,临时Task对象被析构,从而触发handle_.destroy()。
如果我们在此处剥夺了Task的所有权,清理责任就会落空。这种保留所有权的设计,确保了无论是正常执行完毕还是因异常提前中断,底层堆内存都能依托Task临时对象的析构函数被可靠地回收,实现了严格的内存安全。补充说明
在 C++ 中,临时对象的生命周期会持续到包含它的完整表达式(Full-expression)结束(通常是遇到分号 ;)。当我们写下如下代码时:
auto res = co_await do_something();编译器实际上会做如下展开(伪代码):
{ // 1. 调用函数,产生临时的 Task 右值对象 auto&& __tmp_task = do_something(); // 2. 调用 operator co_await,产生临时的 Awaiter 对象 auto&& __awaiter = __tmp_task.operator co_await(); if (!__awaiter.await_ready()) { // 3. 挂起当前协程,并调用 await_suspend __awaiter.await_suspend(current_coro_handle); // <--- 协程在这里彻底挂起,CPU 离开 ---> // <--- 时空流转,无论过了多久,终于被唤醒 ---> } // 4. 唤醒后,调用 await_resume 提取结果 auto res = __awaiter.await_resume(); } // 5. 完整表达式结束!按照构造的相反顺序销毁临时对象:先销毁 __awaiter,再销毁 __tmp_task关键点在于: 协程在挂起时,编译器非常清楚 __tmp_task 和 __awaiter 的生命周期需要跨越挂起点。因此,编译器不会把它们分配在容易被销毁的线程栈(Thread Stack)上,而是直接将它们作为局部变量,打包存储在“当前(父)协程的堆分配状态帧(Coroutine Frame)”中。
这意味着:
Task 对象在整个挂起期间一直安然无恙地活在堆内存里。
唤醒时,Awaiter 也并没有在栈上重建,你访问的依然是挂起前保存在堆里的那个确切的 Awaiter 实例。
Task 必定比 Awaiter 活得更久(先构造的后销毁)。
因此,Awaiter 内部仅持有 handle_ 的一个浅拷贝是绝对安全的,Task 完全不需要把所有权 exchange 给 Awaiter。
结语
设计一个现代 C++ 的
Task类,并非对关键字的简单拼接,而是对执行流跳转和资源生命周期的精密编排。通过懒启动隔离控制流、利用对称传输突破调用栈限制、借助 RAII 保障内存释放,我们最终构建出了一个符合 C++ 哲学体系的高性能并发原语。完整代码
export module xin.task; import std; namespace xin { class FinalAwaiter { public: [[nodiscard]] constexpr auto await_ready() const noexcept -> bool { return false; } template<typename Promise> auto await_suspend(std::coroutine_handle<Promise> handle) const noexcept -> std::coroutine_handle<> { auto next = handle.promise().next; return next ? next : std::noop_coroutine(); } void await_resume() const noexcept {} }; export template<typename T = void> class Task; export template<typename T> class Task { public: class promise_type; using handle_type = std::coroutine_handle<promise_type>; class promise_type { public: auto get_return_object() noexcept -> Task { return Task{ handle_type::from_promise(*this) }; } auto initial_suspend() noexcept -> std::suspend_always { return {}; } auto final_suspend() noexcept -> FinalAwaiter { return {}; } void unhandled_exception() noexcept { exception_ = std::current_exception(); } template<typename U> requires std::convertible_to<U&&, T> void return_value(U&& value) noexcept(std::is_nothrow_constructible_v<T, U&&>) { value_.emplace(std::forward<U>(value)); } [[nodiscard]] auto result() -> T { if (exception_) std::rethrow_exception(exception_); if (!value_) throw std::logic_error{ "No value returned from coroutine" }; auto out = std::move(*value_); value_.reset(); return out; } std::coroutine_handle<> next{ nullptr }; private: std::exception_ptr exception_; std::optional<T> value_; }; Task() = default; Task(handle_type handle) : handle_{ handle } {} Task(const Task&) = delete; auto operator=(const Task&) -> Task& = delete; Task(Task&& other) noexcept : handle_{ std::exchange(other.handle_, {}) } {} auto operator=(Task&& other) noexcept -> Task& { if (this == &other) return *this; if (handle_) handle_.destroy(); handle_ = std::exchange(other.handle_, nullptr); return *this; } ~Task() { if (handle_) handle_.destroy(); } [[nodiscard]] auto done() const noexcept -> bool { return !handle_ || handle_.done(); } [[nodiscard]] auto handle() const noexcept -> handle_type { return handle_; } class Awaiter { public: explicit Awaiter(handle_type handle) : handle_{ handle } {} [[nodiscard]] auto await_ready() const noexcept -> bool { return !handle_ || handle_.done(); } auto await_suspend(std::coroutine_handle<> next) -> std::coroutine_handle<> { handle_.promise().next = next; return handle_; } auto await_resume() const -> T { if (!handle_) throw std::logic_error{ "Invalid coroutine handle" }; return handle_.promise().result(); } private: handle_type handle_; }; auto operator co_await() && noexcept { return Awaiter{ handle_ }; } private: handle_type handle_{ nullptr }; }; export template<> class Task<void> { public: class promise_type; using handle_type = std::coroutine_handle<promise_type>; class promise_type { public: std::coroutine_handle<> next{ nullptr }; auto get_return_object() noexcept -> Task { return Task{ handle_type::from_promise(*this) }; } auto initial_suspend() noexcept -> std::suspend_always { return {}; } auto final_suspend() noexcept -> FinalAwaiter { return {}; } void unhandled_exception() noexcept { exception_ = std::current_exception(); } void return_void() noexcept {} void result() { if (exception_) std::rethrow_exception(exception_); } private: std::exception_ptr exception_; }; Task() = default; Task(handle_type handle) : handle_{ handle } {} Task(const Task&) = delete; auto operator=(const Task&) -> Task& = delete; Task(Task&& other) noexcept : handle_{ std::exchange(other.handle_, nullptr) } {} auto operator=(Task&& other) noexcept -> Task& { if (this == &other) return *this; if (handle_) handle_.destroy(); handle_ = std::exchange(other.handle_, {}); return *this; } ~Task() { if (handle_) handle_.destroy(); } [[nodiscard]] auto done() const noexcept -> bool { return !handle_ || handle_.done(); } [[nodiscard]] auto handle() const noexcept -> handle_type { return handle_; } class Awaiter { public: explicit Awaiter(handle_type handle) : handle_{ handle } { } [[nodiscard]] auto await_ready() const noexcept -> bool { return !handle_ || handle_.done(); } auto await_suspend(std::coroutine_handle<> next) -> std::coroutine_handle<> { handle_.promise().next = next; return handle_; } void await_resume() const { if (!handle_) throw std::logic_error{ "Invalid coroutine handle" }; handle_.promise().result(); } private: handle_type handle_; }; auto operator co_await() && noexcept { return Awaiter{ handle_ }; } private: handle_type handle_{ nullptr }; }; } // namespace xin