捕获 Git SCM 信息

在食谱中处理源代码主要有两种策略

  • **第三方代码**: 当 conanfile.py 食谱打包第三方代码(例如开源库)时,通常最好使用 source() 方法下载或克隆该库的源代码。这是 ConanCenter 的 conan-center-index 存储库采用的方法。

  • **您自己的代码**: 当 conanfile.py 食谱打包您自己的代码时,通常最好将 conanfile.py 与源代码放在同一个存储库中。然后,有两种方法可以实现可重复性

    • 使用 exports_sources(或 export_source() 方法)将源代码的副本与食谱一起捕获到 Conan 包中。这非常简单且实用,建议在大多数情况下使用。

    • 对于无法将源代码存储在 Conan 食谱旁边的场景,例如,当该包要供那些完全无法访问源代码的人使用时,则当前的 **scm 捕获** 方法将是可行的方法。

在 **scm 捕获** 方法中,不是捕获代码本身的副本,而是捕获该代码的“坐标”。在 Git 的情况下,捕获的是存储库的 urlcommit。如果食谱需要从源代码构建,它将使用这些信息获取克隆,如果尝试此操作的用户未经授权,则该过程将失败。他们仍然可以使用我们分发的预编译二进制文件,但无法从源代码构建或访问代码。

让我们看看它是如何工作的,举个例子。请先克隆源代码以重新创建此项目。您可以在 GitHub 上的 examples2 存储库 中找到它们

$ git clone https://github.com/conan-io/examples2.git
$ cd examples2/examples/tools/scm/git/capture_scm

在那里,我们会发现一个小的“hello”项目,包含此 conanfile.py

from conan import ConanFile
from conan.tools.cmake import CMake, cmake_layout
from conan.tools.scm import Git


class helloRecipe(ConanFile):
    name = "hello"
    version = "0.1"

    # Binary configuration
    settings = "os", "compiler", "build_type", "arch"
    options = {"shared": [True, False], "fPIC": [True, False]}
    default_options = {"shared": False, "fPIC": True}
    generators = "CMakeDeps", "CMakeToolchain"

    def export(self):
        git = Git(self, self.recipe_folder)
        # save the url and commit in conandata.yml
        git.coordinates_to_conandata()

    def source(self):
        # we recover the saved url and commit from conandata.yml and use them to get sources
        git = Git(self)
        git.checkout_from_conandata_coordinates()

    ...

我们需要将此代码放在它自己的 Git 存储库中,以查看它在实际情况下的工作方式,因此请在 examples2 存储库之外创建一个文件夹,并将当前文件夹的内容复制到该文件夹,然后

$ mkdir /home/myuser/myfolder # or equivalent in other OS
$ cp -R . /home/myuser/myfolder # or equivalent in other OS
$ cd /home/myuser/myfolder # or equivalent in other OS

# Initialize the git repo
$ git init .
$ git add .
$ git commit . -m wip
# Finally create the package
$ conan create .
...
======== Exporting recipe to the cache ========
hello/0.1: Exporting package recipe: /myfolder/conanfile.py
hello/0.1: Calling export()
hello/0.1: RUN: git status . --short --no-branch --untracked-files
hello/0.1: RUN: git rev-list HEAD -n 1 --full-history -- "."
hello/0.1: RUN: git remote -v
hello/0.1: RUN: git branch -r --contains cb7815a58529130b49da952362ce8b28117dee53
hello/0.1: RUN: git fetch origin --dry-run --depth=1 cb7815a58529130b49da952362ce8b28117dee53
hello/0.1: WARN: Current commit cb7815a58529130b49da952362ce8b28117dee53 doesn't exist in remote origin
This revision will not be buildable in other computer
hello/0.1: RUN: git rev-parse --show-toplevel
hello/0.1: Copied 1 '.py' file: conanfile.py
hello/0.1: Copied 1 '.yml' file: conandata.yml
hello/0.1: Exported to cache folder: /.conan2/p/hello237d6f9f65bba/e
...
======== Installing packages ========
hello/0.1: Calling source() in /.conan2/p/hello237d6f9f65bba/s
hello/0.1: Cloning git repo
hello/0.1: RUN: git clone "<hidden>"  "."
hello/0.1: Checkout: cb7815a58529130b49da952362ce8b28117dee53
hello/0.1: RUN: git checkout cb7815a58529130b49da952362ce8b28117dee53

让我们逐步解释正在发生的事情

  • 当食谱导出到 Conan 缓存时,export() 方法执行 git.coordinates_to_conandata(),后者通过内部调用 git.get_url_and_commit() 将 Git URL 和提交存储在 conandata.yml 文件中。有关这些方法的更多信息,请参见 Git 参考

  • 这会获取指向本地 <local-path>/capture_scm 的存储库的 URL 和提交 8e8764c40bebabbe3ec57f9a0816a2c8e691f559

  • 它警告说,一旦包上传到服务器并尝试在其他计算机上从源代码构建,这些信息将**不足以**重新从源代码构建此食谱,因为其他计算机将不包含 <local-path>/capture_scm 指向的路径。这是预期的,因为我们创建的存储库没有任何远程定义。如果我们的本地克隆定义了一个远程,并且该远程包含我们正在构建的 commit,则 scm_url 将指向远程存储库,从而使从源代码构建完全可重复。

  • export() 方法将 urlcommit 信息存储在 conandata.yml 中,以便将来进行可重复性。

  • 当需要从源代码构建包并调用 source() 方法时,它会从 conandata.yml 文件中的 git.checkout_from_conandata_coordinates() 方法中恢复信息,该方法内部使用它调用 git.clone() 来检索源代码。在这种情况下,它将从 <local-path>/capture_scm 中的本地检出克隆,但如果它定义了远程,它将从中克隆。

警告

为了实现可重复性,对于这种 **scm 捕获** 技术来说,当前的检出非常重要,不能是脏状态。如果是脏状态,则无法保证构建的将来可重复性,因此 git.get_url_and_commit() 会引发错误,并要求提交更改。如果需要多个提交,建议在将更改推送到上游存储库之前压缩这些提交。

如果我们现在执行第二次 conan create .,由于存储库处于脏状态,我们将得到

$ conan create .
hello/0.1: Calling export()
ERROR: hello/0.1: Error in export() method, line 19
    scm_url, scm_commit = git.get_url_and_commit()
    ConanException: Repo is dirty, cannot capture url and commit: .../capture_scm

这可以通过使用 git clean -xdf 清理存储库,或者通过向存储库添加一个包含以下内容的 .gitignore 文件来解决(这在任何情况下都可能是源代码控制的良好实践)

.gitignore
test_package/build
test_package/CMakeUserPresets.json

坐标捕获使用 Git.get_url_and_commit() 方法,该方法默认执行

  • 如果存储库处于脏状态,它将引发异常

  • 如果存储库不处于脏状态,但远程不存在提交,它会发出警告,但会将本地文件夹作为存储库 url 返回。这样,可以在无需将本地提交推送到服务器的情况下测试本地提交。 core.scm:local_url=allow 可以消除警告,而 core.scm:local_url=block 将立即引发错误:此最后一个值可用于 CI 场景,以便快速失败并保存稍后在 conan upload 中会被阻止的构建。

  • 如果尝试使用 conan upload 将使用本地提交构建的包上传到服务器,则会失败,因为这些本地提交不在服务器上,因此包可能不可重复。可以通过设置 core.scm:local_url=allow 来避免此上传错误。

  • 如果存储库不处于脏状态,并且提交存在于服务器上,它将返回远程 URL 和提交。

凭据管理

在上面的示例中,不需要凭据,因为我们的本地存储库不需要它们。但在现实世界中,可能需要凭据。

第一个重要的一点是 git.get_url_and_commit() 将捕获 origin 远程的 url。此 url 不应编码令牌、用户或密码,原因有很多。首先,这会使过程不可重复,不同的构建、不同的用户将获得不同的 url,从而导致不同的食谱修订版。 url 应始终相同。建议的方法是以正交的方式管理凭据,例如使用 ssh 密钥。提供的示例包含一个执行此操作的 Github 操作

.github/workflows/hello-demo.yml
name: Build "hello" package capturing SCM in Github actions
run-name: ${{ github.actor }} checking hello-ci Git scm capture
on: [push]
jobs:
Build:
    runs-on: ubuntu-latest
    steps:
    - name: Check out repository code
        uses: actions/checkout@v3
        with:
        ssh-key: ${{ secrets.SSH_PRIVATE_KEY }}
    - uses: actions/setup-python@v4
        with:
        python-version: '3.10'
    - uses: webfactory/[email protected]
        with:
        ssh-private-key: ${{ secrets.SSH_PRIVATE_KEY }}
    - run: pip install conan
    - run: conan profile detect
    - run: conan create .

hello-demo.yml 负责以下事项

  • 检出 actions/checkout@v3 操作接收 ssh-key 以作为 git@ 而不是 https 进行检出

  • webfactory/[email protected] 操作确保 ssh 密钥在执行后续任务期间也被激活,而不仅仅是在检出期间。

  • 需要在 Github 界面中设置 SSH_PRIVATE_KEY 密钥,以及存储库的 deploy key(包含 ssh 密钥的私钥和公钥)

这样,就可以将身份验证和凭据与食谱功能完全分离,而无需任何泄露凭据的风险。

注意

最佳实践

  • 不要使用在 url 中编码信息的认证机制。这很危险,很容易在日志中泄露凭据。建议使用系统机制,例如 ssh 密钥。

  • 不建议在本地开发中执行 conan create,而是运行 conan install 并本地构建,以避免不必要的提交。只有在本地一切正常后,才开始检查 conan create 流程。