<?xml version="1.0" encoding="UTF-8"?><rss xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/" xmlns:atom="http://www.w3.org/2005/Atom" version="2.0"><channel><title><![CDATA[从零构建基于 C++20 的 Task]]></title><description><![CDATA[<p dir="auto">C++20 引入了无栈协程（Stackless Coroutines）的核心语言机制，但与之相配套的标准库高级抽象（如 <code>std::task</code>）并未同步提供。在构建基于 <code>io_uring</code> 或 <code>epoll</code> 的高性能并发框架时，我们不可避免地需要自行设计一个用于封装异步操作的返回类型：<code>Task&lt;T&gt;</code>。</p>
<p dir="auto">设计这样一个任务类型，不仅仅是对新关键字的语法包装，其本质是在解决两个系统级编程的核心问题：</p>
<ol>
<li><strong>控制流的无缝路由</strong></li>
<li><strong>堆分配状态帧的确定性释放</strong>。</li>
</ol>
<p dir="auto">本文将探讨如何从零构建一个可用的Task&lt;T&gt;。</p>
<h2>1. 异步组合的困境与懒启动（Lazy Evaluation）</h2>
<p dir="auto">在传统的同步流中，函数的调用即意味着执行的开始。但在异步架构中，任务的“构造”与“执行”往往需要被严格分离。</p>
<p dir="auto">为了建立直观的理解，我们可以先参考 Python 中的协程行为。在 Python 中，调用一个 <code>async def</code> 函数并不会立即执行其内部代码，而是仅仅返回一个协程对象：</p>
<pre><code class="language-python">import asyncio

async def fetch_data():
    print("开始发起网络请求...")
    # ...

# 此时并不会打印任何内容，仅仅是构造了一个任务对象
task = fetch_data() 

# 只有显式地等待或交给事件循环，代码才会真正运转
# await task 
</code></pre>
<p dir="auto">这种机制被称为<strong>懒启动（Lazy Evaluation）</strong>。如果我们允许 C++ 的协程在被调用时立即开始执行（即所谓的 Eager Evaluation），它可能会在尚未正确挂载到事件循环（Event Loop）之前，就过早地触发了底层的 I/O 投递操作。这不仅破坏了状态的封装，还极易引发复杂的竞态条件。</p>
<p dir="auto">因此，一个健壮的 C++ <code>Task&lt;T&gt;</code> 必须是懒启动的。这在 C++20 中是通过定制 <code>promise_type</code> 的初始化行为来实现的：</p>
<pre><code class="language-cpp">class promise_type {
public:
    // 协程帧创建后立即挂起，不主动执行协程体代码
    auto initial_suspend() noexcept -&gt; std::suspend_always { return {}; }
    // ...
};
</code></pre>
<p dir="auto">通过返回 <code>std::suspend_always</code>，协程在完成内部状态帧的堆分配后会立刻交出控制权。这种设计使得异步任务可以像普通的数据结构一样被安全地传递、存储和组合，直到调用者显式地通过 <code>co_await</code> 来驱动它。</p>
<h2>2. 协程间的控制流移交</h2>
<p dir="auto">异步操作很少是孤立存在的。当父协程执行 <code>co_await child_task;</code> 时，当前的执行流必须被挂起，并将 CPU 的控制权移交给子协程。同时，子协程必须知晓在自身执行完毕后，应该唤醒哪一个调用者。</p>
<p dir="auto">为了建立这种调用链，我们利用了 <code>co_await</code> 运算符所触发的编译器协议。</p>
<p dir="auto">在 C++20 中，<code>co_await</code> 并非一个简单的挂起指令，而是一个<strong>可定制的控制流拦截点</strong>。当编译器遇到 <code>co_await &lt;expr&gt;</code> 时，它会要求 <code>&lt;expr&gt;</code> 产出一个符合特定接口的 <code>Awaiter</code> 对象，并依次调用其三个核心方法：</p>
<ol>
<li><strong><code>await_ready()</code></strong>：探测状态。询问异步操作是否已经完成。如果返回 <code>true</code>，编译器将走“快速通道”，直接跳过挂起阶段；如果返回 <code>false</code>，则准备挂起当前协程。</li>
<li><strong><code>await_suspend(std::coroutine_handle&lt;&gt;)</code></strong>：核心拦截点。在当前协程的物理状态（寄存器、局部变量）被安全保存到堆上的协程帧后，编译器会调用此方法，并将当前（父）协程的句柄作为参数传入。</li>
<li><strong><code>await_resume()</code></strong>：结果提取点。当协程被再次唤醒时，此方法的返回值将作为整个 <code>co_await</code> 表达式的结果。</li>
</ol>
<p dir="auto">基于这一协议，我们在 <code>Task</code> 内部定义了专门的 <code>Awaiter</code>，以此来接管并路由控制流：</p>
<pre><code class="language-cpp">class Awaiter {
public:
    explicit Awaiter(handle_type handle) : handle_{ handle } {}

    // 1. 探测状态：如果子协程尚未执行完毕，则强制父协程挂起
    bool await_ready() const noexcept 
    { 
        return !handle_ || handle_.done(); 
    }

    // 2. 挂起时的控制流路由
    auto await_suspend(std::coroutine_handle&lt;&gt; next) -&gt; std::coroutine_handle&lt;&gt; 
    {
        // 将父协程的句柄 (next) 记录在子协程的 promise 状态中
        handle_.promise().next = next;
        // 返回子协程的句柄，指示 C++ 运行时将执行流切换至子协程
        return handle_;
    }

    // 3. 唤醒后的结果提取
    auto await_resume() const -&gt; T 
    {
        if (!handle_) throw std::logic_error{ "Invalid handle" };
        return handle_.promise().result();
    }

private:
    handle_type handle_; // 子协程的句柄
};
</code></pre>
<p dir="auto">通过这一套状态机转换，C++ 将底层的调度权完全下放给了库作者。</p>
<p dir="auto">在 <code>await_suspend</code> 执行的瞬间，父协程已被安全冻结。</p>
<p dir="auto">我们将其句柄保存在子协程的 <code>promise_type::next</code> 字段里，从而在内存中建立了一个单向的调用链表（父 -&gt; 子）。</p>
<p dir="auto">紧接着返回子协程的 <code>handle_</code>，运行时会直接跳转执行子协程代码，实现了零开销的上下文切换。</p>
<h2>3. 栈溢出风险与对称传输（Symmetric Transfer）</h2>
<p dir="auto">子协程执行到末尾（或遇到 <code>co_return</code>）时，需要唤醒之前等待它的父协程。这往往是自定义协程实现中最容易出错的环节。</p>
<p dir="auto">直觉上的做法是，在子协程的收尾阶段直接调用 <code>next.resume()</code>。然而，这种非对称传输（Asymmetric Transfer）存在致命缺陷：</p>
<p dir="auto"><code>resume()</code> 本质上是一个常规的同步函数调用。</p>
<p dir="auto">在网络服务这类存在深层嵌套或无限循环挂起的场景中（例如 <code>while(true) { co_await read(); }</code>），每一次 <code>resume()</code> 都会在操作系统的线程栈上压入一个新的栈帧。调用链越长，栈越深，最终必然导致 Stack Overflow（栈溢出）。</p>
<p dir="auto">为了提供工业级的稳定性，<code>Task</code> 在收尾时必须采用<strong>对称传输（Symmetric Transfer）</strong>：</p>
<pre><code class="language-cpp">class FinalAwaiter {
public:
    bool await_ready() const noexcept { return false; }

    template&lt;typename Promise&gt;
    auto await_suspend(std::coroutine_handle&lt;Promise&gt; handle) const noexcept -&gt; std::coroutine_handle&lt;&gt; 
    {
        auto next = handle.promise().next;
        // 关键点：直接返回父协程的句柄，而非调用 next.resume()
        return next ? next : std::noop_coroutine();
    }

    void await_resume() const noexcept {}
};

// 在 promise_type 中指定收尾行为：
auto final_suspend() noexcept -&gt; FinalAwaiter { return {}; }
</code></pre>
<p dir="auto">通过让 <code>final_suspend</code> 返回一个包含父协程句柄的 <code>Awaiter</code>，编译器会采用类似尾调用优化（Tail Call）的机制：</p>
<p dir="auto"><strong>它会首先将当前子协程的物理栈帧安全剥离，然后再以平级跳转的方式进入父协程。</strong></p>
<p dir="auto">在这种机制的保障下，无论业务逻辑中 <code>co_await</code> 嵌套了多少层，底层的线程调用栈深度始终保持恒定 (O(1))。</p>
<h2>4. 返回值的提取与异常路由</h2>
<p dir="auto">异步任务不仅涉及控制流的跳转，还必须安全地跨越挂起边界传递数据或异常，并且表现得如同普通的 C++ 函数调用一样。</p>
<p dir="auto">在子协程内部，产生的值或未捕获的异常被分别存储在 <code>promise_type</code> 的 <code>std::optional&lt;T&gt;</code> 和 <code>std::exception_ptr</code> 中。当父协程通过对称传输被唤醒，并执行 <code>await_resume()</code> 时，需要提取这些结果：</p>
<pre><code class="language-cpp">auto result() -&gt; T 
{
    if (exception_) 
        std::rethrow_exception(exception_);
    return std::move(value_).value();
}
</code></pre>
<p dir="auto">这里包含两个重要的设计约束：</p>
<ol>
<li><strong>异常透明性</strong>：<code>std::rethrow_exception</code> 确保了子协程中发生的异常能够被无缝抛出，并被父协程的 <code>try-catch</code> 块捕获，维持了 C++ 异常处理语义的连贯性。</li>
<li><strong>资源所有权转移</strong>：通过 <code>std::move</code> 提取值，保证了诸如 <code>std::unique_ptr</code> 或封装了系统资源（如文件描述符）的不可拷贝对象（Move-Only Types）能够被正确返回。</li>
</ol>
<h2>5. 协程帧的生命周期管理与单次消费语义</h2>
<p dir="auto">无栈协程的局部变量和 <code>promise_type</code> 被编译器分配在堆上的协程帧（Coroutine Frame）中。由于 C++ 没有垃圾回收机制，资源泄漏是协程编程中的主要风险之一。</p>
<p dir="auto">依据 C++ 核心的 RAII（资源获取即初始化）原则，<code>Task</code> 对象作为协程句柄的唯一持有者，理应负责这块内存的清理：</p>
<pre><code class="language-cpp">template&lt;typename T&gt;
class Task {
public:
    ~Task() 
    { 
        if (handle_) handle_.destroy(); 
    }

    // 限制为右值调用，且不转移 handle_ 的所有权
    auto operator co_await() &amp;&amp; noexcept { return Awaiter{ handle_ }; }
};
</code></pre>
<p dir="auto">这里有两个深思熟虑的设计权衡：</p>
<p dir="auto"><strong>第一：为什么限制 <code>operator co_await</code> 为右值版本（<code>&amp;&amp;</code>）？</strong><br />
协程代表一个异步计算过程，其内部结果（特别是前文提到的 Move-Only 类型）在 <code>await_resume</code> 中是被破坏性提取的（<code>std::move</code>）。这意味着一个 <code>Task</code> 在逻辑上只能被消费一次。如果允许对左值的 <code>Task</code> 进行 <code>co_await</code>，调用者可能会意外地多次等待同一个任务：</p>
<pre><code class="language-cpp">Task&lt;int&gt; t = do_work();
auto res1 = co_await t;
auto res2 = co_await t; // 错误：底层协程已经结束，状态帧已被销毁
</code></pre>
<p dir="auto">通过添加 <code>&amp;&amp;</code> 限定符，我们利用 C++ 的类型系统在编译期强制执行了“单次消费（Single-Shot）”语义。调用者必须直接等待临时对象（如 <code>co_await do_work();</code>），或者显式地转移所有权（<code>co_await std::move(t);</code>）。这在接口层面明确了状态机的生命周期契约。</p>
<p dir="auto"><strong>第二：为什么在右值版本中，依然不剥夺 Task 的所有权？</strong><br />
通常在处理右值时，我们会使用 <code>std::exchange</code> 来转移底层资源。但在这里，我们仅向 <code>Awaiter</code> 传递了句柄的值。<br />
当执行 <code>auto res = co_await do_work();</code> 时，<code>do_work()</code> 产生的 <code>Task</code> 临时对象的生命周期会被编译器自动延续，直到整个 <code>co_await</code> 表达式求值完毕（即 <code>await_resume()</code> 返回之后）。此时，临时 <code>Task</code> 对象被析构，从而触发 <code>handle_.destroy()</code>。<br />
如果我们在此处剥夺了 <code>Task</code> 的所有权，清理责任就会落空。这种保留所有权的设计，确保了无论是正常执行完毕还是因异常提前中断，底层堆内存都能依托 <code>Task</code> 临时对象的析构函数被可靠地回收，实现了严格的内存安全。</p>
<p dir="auto"><strong>补充说明</strong><br />
在 C++ 中，临时对象的生命周期会持续到包含它的完整表达式（Full-expression）结束（通常是遇到分号 ;）。</p>
<p dir="auto">当我们写下如下代码时：</p>
<pre><code class="language-c++">auto res = co_await do_something();
</code></pre>
<p dir="auto">编译器实际上会做如下展开（伪代码）：</p>
<pre><code class="language-c++">{
    // 1. 调用函数，产生临时的 Task 右值对象
    auto&amp;&amp; __tmp_task = do_something(); 
    
    // 2. 调用 operator co_await，产生临时的 Awaiter 对象
    auto&amp;&amp; __awaiter = __tmp_task.operator co_await();
    
    if (!__awaiter.await_ready()) {
        // 3. 挂起当前协程，并调用 await_suspend
        __awaiter.await_suspend(current_coro_handle);
        // &lt;--- 协程在这里彻底挂起，CPU 离开 ---&gt;
        // &lt;--- 时空流转，无论过了多久，终于被唤醒 ---&gt;
    }
    
    // 4. 唤醒后，调用 await_resume 提取结果
    auto res = __awaiter.await_resume();
    
} // 5. 完整表达式结束！按照构造的相反顺序销毁临时对象：先销毁 __awaiter，再销毁 __tmp_task
</code></pre>
<p dir="auto">关键点在于： 协程在挂起时，编译器非常清楚 __tmp_task 和 __awaiter 的生命周期需要跨越挂起点。因此，编译器不会把它们分配在容易被销毁的线程栈（Thread Stack）上，而是直接将它们作为局部变量，打包存储在“当前（父）协程的堆分配状态帧（Coroutine Frame）”中。</p>
<p dir="auto">这意味着：</p>
<p dir="auto">Task 对象在整个挂起期间一直安然无恙地活在堆内存里。</p>
<p dir="auto">唤醒时，Awaiter 也并没有在栈上重建，你访问的依然是挂起前保存在堆里的那个确切的 Awaiter 实例。</p>
<p dir="auto">Task 必定比 Awaiter 活得更久（先构造的后销毁）。</p>
<p dir="auto">因此，Awaiter 内部仅持有 handle_ 的一个浅拷贝是绝对安全的，Task 完全不需要把所有权 exchange 给 Awaiter。</p>
<h2>结语</h2>
<p dir="auto">设计一个现代 C++ 的 <code>Task</code> 类，并非对关键字的简单拼接，而是对执行流跳转和资源生命周期的精密编排。通过懒启动隔离控制流、利用对称传输突破调用栈限制、借助 RAII 保障内存释放，我们最终构建出了一个符合 C++ 哲学体系的高性能并发原语。</p>
<h3>完整代码</h3>
<pre><code class="language-c++">export module xin.task;

import std;

namespace xin {

class FinalAwaiter {
public:
    &lsqb;&lsqb;nodiscard&rsqb;&rsqb;
    constexpr auto await_ready() const noexcept -&gt; bool
    {
        return false;
    }

    template&lt;typename Promise&gt;
    auto await_suspend(std::coroutine_handle&lt;Promise&gt; handle) const noexcept -&gt; std::coroutine_handle&lt;&gt;
    {
        auto next = handle.promise().next;
        return next ? next : std::noop_coroutine();
    }

    void await_resume() const noexcept {}
};


export template&lt;typename T = void&gt;
class Task;

export template&lt;typename T&gt;
class Task {
public:
    class promise_type;
    using handle_type = std::coroutine_handle&lt;promise_type&gt;;

    class promise_type {
    public:
        auto get_return_object() noexcept -&gt; Task { return Task{ handle_type::from_promise(*this) }; }

        auto initial_suspend() noexcept -&gt; std::suspend_always { return {}; }

        auto final_suspend() noexcept -&gt; FinalAwaiter { return {}; }

        void unhandled_exception() noexcept { exception_ = std::current_exception(); }

        template&lt;typename U&gt;
            requires std::convertible_to&lt;U&amp;&amp;, T&gt;
        void return_value(U&amp;&amp; value) noexcept(std::is_nothrow_constructible_v&lt;T, U&amp;&amp;&gt;)
        {
            value_.emplace(std::forward&lt;U&gt;(value));
        }

        &lsqb;&lsqb;nodiscard&rsqb;&rsqb;
        auto result() -&gt; T
        {
            if (exception_)
                std::rethrow_exception(exception_);

            if (!value_)
                throw std::logic_error{ "No value returned from coroutine" };

            auto out = std::move(*value_);
            value_.reset();
            return out;
        }

        std::coroutine_handle&lt;&gt; next{ nullptr };

    private:
        std::exception_ptr exception_;
        std::optional&lt;T&gt; value_;
    };

    Task() = default;

    Task(handle_type handle)
      : handle_{ handle }
    {}

    Task(const Task&amp;) = delete;
    auto operator=(const Task&amp;) -&gt; Task&amp; = delete;

    Task(Task&amp;&amp; other) noexcept
      : handle_{ std::exchange(other.handle_, {}) }
    {}

    auto operator=(Task&amp;&amp; other) noexcept -&gt; Task&amp;
    {
        if (this == &amp;other)
            return *this;

        if (handle_)
            handle_.destroy();

        handle_ = std::exchange(other.handle_, nullptr);
        return *this;
    }

    ~Task()
    {
        if (handle_)
            handle_.destroy();
    }

    &lsqb;&lsqb;nodiscard&rsqb;&rsqb;
    auto done() const noexcept -&gt; bool
    {
        return !handle_ || handle_.done();
    }

    &lsqb;&lsqb;nodiscard&rsqb;&rsqb;
    auto handle() const noexcept -&gt; handle_type
    {
        return handle_;
    }

    class Awaiter {
    public:
        explicit Awaiter(handle_type handle)
          : handle_{ handle }
        {}

        &lsqb;&lsqb;nodiscard&rsqb;&rsqb;
        auto await_ready() const noexcept -&gt; bool
        {
            return !handle_ || handle_.done();
        }

        auto await_suspend(std::coroutine_handle&lt;&gt; next) -&gt; std::coroutine_handle&lt;&gt;
        {
            handle_.promise().next = next;
            return handle_;
        }

        auto await_resume() const -&gt; T
        {
            if (!handle_)
                throw std::logic_error{ "Invalid coroutine handle" };

            return handle_.promise().result();
        }

    private:
        handle_type handle_;
    };

    auto operator co_await() &amp;&amp; noexcept { return Awaiter{ handle_ }; }

private:
    handle_type handle_{ nullptr };
};


export template&lt;&gt;
class Task&lt;void&gt; {
public:
    class promise_type;
    using handle_type = std::coroutine_handle&lt;promise_type&gt;;

    class promise_type {
    public:
        std::coroutine_handle&lt;&gt; next{ nullptr };

        auto get_return_object() noexcept -&gt; Task { return Task{ handle_type::from_promise(*this) }; }

        auto initial_suspend() noexcept -&gt; std::suspend_always { return {}; }

        auto final_suspend() noexcept -&gt; FinalAwaiter { return {}; }

        void unhandled_exception() noexcept { exception_ = std::current_exception(); }

        void return_void() noexcept {}

        void result()
        {
            if (exception_)
                std::rethrow_exception(exception_);
        }

    private:
        std::exception_ptr exception_;
    };

    Task() = default;

    Task(handle_type handle)
      : handle_{ handle }
    {}

    Task(const Task&amp;) = delete;
    auto operator=(const Task&amp;) -&gt; Task&amp; = delete;

    Task(Task&amp;&amp; other) noexcept
      : handle_{ std::exchange(other.handle_, nullptr) }
    {}

    auto operator=(Task&amp;&amp; other) noexcept -&gt; Task&amp;
    {
        if (this == &amp;other)
            return *this;

        if (handle_)
            handle_.destroy();

        handle_ = std::exchange(other.handle_, {});
        return *this;
    }

    ~Task()
    {
        if (handle_)
            handle_.destroy();
    }

    &lsqb;&lsqb;nodiscard&rsqb;&rsqb;
    auto done() const noexcept -&gt; bool
    {
        return !handle_ || handle_.done();
    }

    &lsqb;&lsqb;nodiscard&rsqb;&rsqb;
    auto handle() const noexcept -&gt; handle_type
    {
        return handle_;
    }

    class Awaiter {
    public:
        explicit Awaiter(handle_type handle)
          : handle_{ handle }
        {
        }

        &lsqb;&lsqb;nodiscard&rsqb;&rsqb;
        auto await_ready() const noexcept -&gt; bool
        {
            return !handle_ || handle_.done();
        }

        auto await_suspend(std::coroutine_handle&lt;&gt; next) -&gt; std::coroutine_handle&lt;&gt;
        {
            handle_.promise().next = next;
            return handle_;
        }

        void await_resume() const
        {
            if (!handle_)
                throw std::logic_error{ "Invalid coroutine handle" };

            handle_.promise().result();
        }

    private:
        handle_type handle_;
    };

    auto operator co_await() &amp;&amp; noexcept { return Awaiter{ handle_ }; }

private:
    handle_type handle_{ nullptr };
};

} // namespace xin
</code></pre>
]]></description><link>http://forum.d2learn.org/topic/187/从零构建基于-c-20-的-task</link><generator>RSS for Node</generator><lastBuildDate>Fri, 17 Apr 2026 09:16:11 GMT</lastBuildDate><atom:link href="http://forum.d2learn.org/topic/187.rss" rel="self" type="application/rss+xml"/><pubDate>Mon, 13 Apr 2026 02:37:59 GMT</pubDate><ttl>60</ttl></channel></rss>