SWIG 是一个非常优秀的开源工具,支持您将 C/C++ 代码与任何主流脚本语言相集成。此外,它向更广泛的受众公开了基本代码,改善了可测试性,让您的 Ruby 代码库某部分能快速写出高性能的 C/C++ 模块。

Arpan Sen, 独立作家

Arpan Sen 是致力于电子设计自动化行业的软件开发首席工程师。他使用各种 UNIX 版本(包括 Solaris、SunOS、HP-UX 和 IRIX)以及 Linux 和 Microsoft Windows 已经多年。他热衷于各种软件性能优化技术、图论和并行计算。Arpan 获得了软件系统硕士学位。



2012 年 5 月 28 日

SWIG 安装

本文使用了 SWIG 版本 2.0.4(参见 参考资料 获取下载站点的链接)。要构建和安装 SWIG,可按照典型的开源安装流程,在命令提示符下输入以下命令:

请注意,为前缀提供的路径必须是绝对路径。

CC++ 被公认为(理当如此)创建高性能代码的首选平台。对开发人员的一个常见要求是向脚本语言接口公开 C/C++ 代码,这正是 Simplified Wrapper and Interface Generator (SWIG) 的用武之地。SWIG 允许您向广泛的脚本语言公开 C/C++ 代码,包括 Ruby、Perl、Tcl 和 Python。本文使用 Ruby 作为公开 C/C++ 功能的首选脚本接口。要理解本文,您必须具备 C/C++ 与 Ruby 方面的相应知识。

SWIG 是一款不错的工具,可适合多种场景,其中包括:

  • C/C++ 代码提供一个脚本接口,使用户更容易使用
  • 向您的 Ruby 代码添加扩展或将现有的模块替换为高性能的替代模块
  • 提供使用脚本环境对代码执行单元和集成测试的能力
  • 使用 TK 开发一个图形用户接口并将它与 C/C++ 后端集成

此外,与 GNU Debugger 每次都需触发相比,SWIG 要容易调试得多。

Ruby 环境变量

SWIG 生成包装器 C/C++ 代码时需要 ruby.h 来保证进行正确的编译。在您的 Ruby 安装中检查 ruby.h:一种建议的做法是将环境变量 RUBY_INCLUDE 指向包含 ruby.h 的文件夹,将 RUBY_LIB 指向包含 Ruby 库的路径。

使用 SWIG 编写 Hello World

作为输入,SWIG 需要一个包含 ANSI C/C++ 声明和 SWIG 指令的文件。我将此输入文件称为 SWIG 接口文件。一定要记住,SWIG 仅需要足够生成包装器代码的信息。该接口文件通常具有 *.i*.swg 扩展名。以下是第一个扩展文件 test.i:

%module test
%constant char* Text = "Hello World with SWIG"

使用 SWIG 运行此代码:

swig –ruby test.i

第二个代码段中的命令行在当前文件夹中生成一个名为 test_wrap.c 的文件。现在,您需要在此 C 文件中创建一个共享库。以下是该命令行:

bash$ gcc –fPIC –c test_wrap.c –I$RUBY_INCLUDE
bash$ gcc –shared test_wrap.o –o test_wrap.so –lruby –L$RUBY_LIB

就这么简单。您已准备就绪,那就触发交互式 Ruby shell (IRB),输入 require 'test_wrap' 来检查 Ruby Test 模块和它的内容。以下是扩展的 Ruby 端:

irb(main):001:0> require 'test_wrap'
=> true
irb(main):002:0> Test.constants
=> ["Text"]
irb(main):003:0> Test:: Text
=> "Hello World with SWIG"

SWIG 可用于生成各种语言扩展,只需运行 swig –help 检查所有的可用选项。对于 Ruby,可以输入 swig –ruby <interface file>;对于 Perl,可以使用 swig –perl <interface file>

也可以使用 SWIG 生成 C++ 代码:只需在命令行使用 –c++ 即可。在前面的示例中,运行 swig –c++ –ruby test.i 会在当前文件夹中生成一个名为 test_wrap.cxx 的文件。


SWIG 基础知识

SWIG 接口文件语法是 C 的一个超集。SWIG 通过一个定制 C 预处理器处理它的输入文件。此外,接口文件中的 SWIG 操作通过一个百分比符号 (%) 后跟的特殊的指令(%module%constant 等)来控制。SWIG 接口还允许您定义以 %{ 开头和以 %} 结束的信息块。%{%} 之间的所有内容会原封不动地复制到生成的包装器文件中。

模块名称的更多信息

可通过指定 %module "rubytest::test34::example,定义一个深度嵌套模块 rubytest::test34::example。另一个选项是将 %module example 放在接口代码中,在命令行添加 rubytest::test34 作为它的前缀,如下所示:

SWIG 接口文件必须以 %module 声明开头,例如 %module module-name,其中 module-name 是目标语言扩展模块的名称。如果目标语言是 Ruby,这类似于创建一个 Ruby 模块。可以提供命令行选项 –module module-name-modified 来改写模块名称:在本例中,目标语言模块名称为(或许您已猜到)module-name-modified。现在,让我们看看常量。

模块初始化功能

SWIG 拥有一个特殊指令 %init,用于定义模块初始化功能。%{ … %} 代码块中 %init 之后定义的代码会在模块加载时调用。以下是代码:

%module test
%constant char* Text = “Hello World with SWIG”
%init %{ 
printf(“Initialization etc. gets done here\n”);
%}

现在重新启动 IRB。以下是在加载模块后得到的代码:

irb(main):001:0> require 'test'
Initialization etc. gets done here 
=> true

SWIG 常量

C/C++ 常量可在接口文件中以多种方式定义。要验证是否向 Ruby 模块公开了相同的常量,只需在加载共享库时在 IRB 提示符下键入 <module-name>.constants。可以以下任何方式定义常量:

  • 在一个接口文件中使用 #define
  • 使用 enum
  • 使用 %constant 指令

请注意,Ruby 常量必需以一个大写字母开头。所以,如果接口文件有诸如 #define pi 3.1415 的声明,SWIG 会自动将它更正为 #define Pi 3.1415 并在此流程中生成一条警告消息:

bash$ swig –c++ –ruby test.i
test.i(3) : Warning 801: Wrong constant name (corrected to 'Pi')

下面的示例包含大量常量。作为 swig –ruby test.i 运行它:

%module test
#define S_Hello "Hello World"
%constant double PI = 3.1415
enum days {Sunday = 1, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday};

清单 1 显示了 SWIG 的输出。

清单 1. 向 Ruby 公开 C 枚举:哪里出错了?
test_wrap.c: In function `Init_test':
test_wrap.c:2147: error: `Sunday' undeclared (first use in this function)
test_wrap.c:2147: error: (Each undeclared identifier is reported only once
test_wrap.c:2147: error: for each function it appears in.)
test_wrap.c:2148: error: `Monday' undeclared (first use in this function)
test_wrap.c:2149: error: `Tuesday' undeclared (first use in this function)
test_wrap.c:2150: error: `Wednesday' undeclared (first use in this function)
test_wrap.c:2151: error: `Thursday' undeclared (first use in this function)
test_wrap.c:2152: error: `Friday' undeclared (first use in this function)
test_wrap.c:2153: error: `Saturday' undeclared (first use in this function)

哎哟:发生什么事了?如果打开 test_wrap.c(清单 2),就可以看到问题。

清单 2. 使用 SWIG 生成的枚举代码
  rb_define_const(mTest, "Sunday", SWIG_From_int((int)(Sunday)));
  rb_define_const(mTest, "Monday", SWIG_From_int((int)(Monday)));
  rb_define_const(mTest, "Tuesday", SWIG_From_int((int)(Tuesday)));
  rb_define_const(mTest, "Wednesday", SWIG_From_int((int)(Wednesday)));
  rb_define_const(mTest, "Thursday", SWIG_From_int((int)(Thursday)));
  rb_define_const(mTest, "Friday", SWIG_From_int((int)(Friday)));
  rb_define_const(mTest, "Saturday", SWIG_From_int((int)(Saturday)));

SWIG 从 Sunday、Monday 等变量中创建 Ruby 常量,但生成的文件中缺少 day 原始的 enum 声明。解决此问题的最简单方式是将 enum 代码放在 %{ … %} 信息块内,使生成的文件知道枚举常量,如 清单 3 所示。

清单 3. 以正确的方式向 Ruby 公开 C 枚举
%module test
#define S_Hello "Hello World"
%constant double PI = 3.1415
enum days {Sunday = 1, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday}; 
%{
enum days {Sunday = 1, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday}; 
%}

请注意,只有 enum 声明不会使枚举常量可用于脚本环境:您同时需要 %{ … %} 中的 C 代码和接口文件中的 enum 声明。

%inline 特殊指令简介

清单 3 有点奇怪 — 存在没有必要的 enum 代码副本。要删除副本,需要使用 %inline SWIG 指令。%inline 指令将 %{ … %} 信息块中的所有代码插入接口文件中,以同时满足 SWIG 预处理器和 C 编译器的需求。清单 4 显示了修订的代码,enum 现在使用了 %inline

清单 4. 使用 %inline 指令减少代码副本
%module test
#define S_Hello "Hello World"
%constant double PI = 3.1415
%inline %{
enum days {Sunday = 1, Monday, Tuesday, Wednesday, Thursday, Friday, Saturday}; 
%}

%include 是一种均衡的清除方法

在复杂的企业环境中,可能有一些 C/C++ 头文件定义了您希望向脚本框架公开的全局变量和常量。在接口文件中使用 %include <header.h>%{ #include <header.h> %},可解决在头文件中重复所有元素的声明的问题。清单 5 显示了该代码。

清单 5. 使用 %include 指令
%module test
%include "header.h"

%{
#include "header.h"
%}

%include 指令还适用于 C/C++ 源文件。当与源文件一起使用时,SWIG 自动会将所有函数声明为 extern


常量足够多了:让我们公开一些函数

开始学习 SWIG 的最简单方式是在接口文件中声明某个 C 函数,在某个源文件中定义它,在创建共享库时链接相应的目标文件。第一个示例展示了计算一个数的阶乘的函数:

%module test
unsigned long factorial(unsigned long);

以下是我编译为 factorial.o 并在创建 test.so 时链接的 C 代码:

unsigned long factorial(unsigned long n) {
   return n == 1 ? 1 : n * factorial(n - 1);
}

清单 6 显示了 Ruby 接口。

清单 6. 从 Ruby 测试代码
irb(main):001:0> require 'test'
=> true
irb(main):002:0> Test.factorial(11)
=> 39916800
irb(main):003:0> Test.factorial(34)
=> 0

Factorial 34 失败了,因为 unsigned 类型的 long 没有足够的大小来存放结果。

Ruby 到 C/C++ 的变量映射

让我们从简单的全局变量开始。请注意,C/C++ 全局变量对 Ruby 而言不是真正全局的:只能以模块属性的形式访问它们。将以下全局变量添加到一个 C 文件中,像链接函数一样链接源文件。SWIG 自动为您生成这些变量的 setter 和 getter 方法。以下是 C 代码:

int global_int1;
long global_long1;
float global_float1; 
double global_double1;

清单 7 显示了相同的接口。

清单 7. 向 Ruby 公开 C 接口
%module test
%inline %{
extern int global_int1;
extern long global_long1;
extern float global_float1; 
extern double global_double1; 
%}

现在,加载相应的 Ruby 模块以验证添加的 setter 和 getter 方法:

irb(main):003:0> Test.methods
[…"global_float1", "global_float1=", "global_int1", "global_int1=", "global_long1", 
   "global_long1=", "global_double1", "global_double1=", …]

现在访问变量就非常简单了:

irb(main):004:0> Test.global_long1 = 4327911
=> 4327911
irb(main):005:0> puts Test.global_long1
=> 4327911

特别有趣的是 Ruby 转换 intlongfloatdouble 后的结果。请参见 清单 8

清单 8. 在 Ruby 和 C/C++ 之间的类型映射
irb(main):009:0> Test::global_long1.class
=> Fixnum
irb(main):010:0> Test::global_int1.class
=> Fixnum
irb(main):011:0> Test::global_double1.class
=> Float
irb(main):012:0> Test::global_float1.class
=> Float

将结构和类从 C++ 映射到 Ruby

向 Ruby 公开结构和类与 C/C++ 中的传统数据类型完全相同。在接口文件中声明结构和相关的方法。清单 9 声明一个简单的 Point 结构和一个函数来计算它们之间的距离。在 Ruby 端,您将一个新 Point 创建为 Test::Point.new,以 Test.distance_between 的形式调用计算距离。distance_between 函数在一个独立的 C++ 源文件中定义,该文件链接到模块共享库。以下是 SWIG 接口代码:

清单 9. 向 Ruby 公开结构和相关接口
%module test

%inline %{
typedef struct Point {
  int x;
  int y;
};
extern float distance_between(Point& p1, Point& p2);
%}

清单 10 展示了 Ruby 的用法。

清单 10. 从 Ruby 验证 C/C++ 功能
irb(main):002:0> a = Test::Point.new
=> #<Test::Point:0x2d04260>
irb(main):003:0> a.x = 10
=> 10
irb(main):004:0> a.y = 20
=> 20
irb(main):005:0> b = Test::Point.new
=> #<Test::Point:0x2cce668>
irb(main):006:0> b.x = 20
=> 20
irb(main):007:0> b.y = 10
=> 10
irb(main):008:0> Test.distance_between(a, b)
=> 14.1421356201172

这个使用模型应该很清楚地说明了,为什么 SWIG 是在设置基本代码的单元或集成测试框架时的一个优秀、方便的工具。

%defaultctor 和其他属性

如果查看一个点的 xy 坐标的默认值,可以看到它们显示为 0。这不是巧合。SWIG 为您的结构生成了默认的构造函数。可以通过在接口文件中指定 %nodefaultctor Point; 来关闭此行为。清单 11 显示了如何做。

清单 11. 没有针对 C++ 结构的默认构造函数
%module test
%nodefaultctor Point;
%inline %{
typedef struct Point {
  int x;
  int y;
};
%}

现在还需要为 Point 结构提供一个显式的构造函数。否则,您将看到以下代码:

irb(main):005:0> a = Test::Point.new
TypeError: allocator undefined for Test::Point
        from (irb):5:in `new'
        from (irb):5

可通过在接口文件中指定 %nodefaultctor;,让每个结构显式定义自己的构造函数。SWIG 也为析构函数中的类似功能定义了 %nodefaultdtor 指令。


C++ 继承和 Ruby 接口

为简单起见,假设接口函数中有两个 C++ 类 —BaseDerived。SWIG 充分意识到 Derived 派生自 Base。从 Ruby 角度讲,您只需使用 Derived.new,就可以放心地期待创建的对象知道它派生自 Base清单 12 展示了 Ruby 测试代码;在 C++ 或 SWIG 接口端没有特定的操作需要执行。

清单 12. SWIG 接口处理 C++ 继承
irb(main):003:0> a = Test::Derived.new
=> #<Test::Derived:0x2d06270>
irb(main):004:0> a.instance_of? Test::Derived
=> true
irb(main):005:0> a.instance_of? Test::Base
=> false
irb(main):006:0> Test::Derived < Test::Base
=> true
irb(main):007:0> Test::Derived > Test::Base
=> false
irb(main):008:0> a.is_a? Test::Derived
=> true
irb(main):009:0> a.is_a? Test::Base
=> true

该处理过程没有使用 C++ 多个继承那么流畅。如果 Derived 继承自 Base1Base2,那么默认的 SWIG 行为只需忽略 Base2。以下是您将从 SWIG 获得的消息:

Warning 802: Warning for Derived d: base Base2 ignored. 
   Multiple inheritance is not supported in Ruby.

坦诚地讲,SWIG 不能出错,因为 Ruby 不支持多个继承。SWIG 要正常工作,您需要在命令行中传递 –minherit 选项:

bash$ swig -ruby -minherit -c++ test.i

一定要了解 SWIG 如何处理多重继承。C++ 中的派生类对应于 Ruby 中的一个类,这个类既不是派生自 Base1,也不是派生自 Base2。相反,Base1Base2 代码重构为模块并包含在 Derived 中。这就是 Ruby 术语中所称的 mixin清单 13 展示了所发生事件的伪代码。

清单 13. 使用 Ruby 模拟多个继承
class Base1
  module Impl
  # Define Base1 methods here
  end
  include Impl
end

class Base2
  module Impl
  # Define Base2 methods here
  end
  include Impl
end

class Derived
  module Impl
  include Base1::Impl
  include Base2::Impl
  # Define Derived methods here
  end
  include Impl
end

让我们验证一下来自 Ruby 接口的声明。included_modules 模块为您完成了此任务,如 清单 14 中所示。

清单 14. Ruby 类中包含的多个模块
irb> Test::Derived.included_modules
=> [Test::Derived::Impl, Test::Base::Impl, Test::Base2::Impl, Kernel]

irb> Test::Derived < Test::Base
=> nil

irb> Test::Derived < Test::Base2
=> nil

请注意,类层次结构测试失败了(理应如此),但对于应用程序开发人员来说,BaseBase2 的功能仍可通过 Derived 类使用。


指针和 Ruby 接口

Ruby 没有与指针类似的东西,那么接受或返回指针的 C/C++ 方法怎么办?这为我们带来了 SWIG 这样的系统的一个最重要的挑战,这一系统的主要任务是在源和目标语言之间转换(或俗称编组)数据类型。仔细考虑下面的 C 函数:

void addition(const int* n1, const int* n2, int* result) { 
  *result = *n1 + *n2;
}

为解决这个问题,SWIG 引入了类型映射 的概念。您能够灵活地将您想要的 Ruby 类型映射到 int*float* 等类型。幸运的是,SWIG 已为您完成了大部分样板工作。以下是您可能需要添加的最简单的接口:

%module Test
%include typemaps.i
void addition (int* INPUT, int* INPUT, int* OUTPUT);

%{ extern void addition(int*, int*, int*); %}

现在,从 Ruby 试用代码 Test::addition(1, 2)。您应该能够看到结果。要更详细地了解此处发生的事情,可以查看 lib/ruby 文件夹。SWIG 使用 int* INPUT 语法将底层指针转换为对象。将一个类型从 Ruby 映射到 C/C++ 的 SWIG 语法为:

%typemap(in) int* {
  … type conversion code from Ruby to C/C++
}

同样地,从 C/C++ 到 Ruby 的类型转换代码为:

%typemap(out) int* {
  … type convesion code from C/C++ to Ruby
}

类型映射不只是为指针带来了方便:可将它们用于 Ruby 与 C/C++ 之间的任何数据类型转换。


结束语

在本文中,您学习了如何向 Ruby 接口公开 C/C++ 常量、包含结构和类的变量、函数,以及枚举。在此过程中,我们介绍了一些 SWIG 指令,比如 %module%init%constant%inline%include%nodefaultctor。SWIG 提供的功能远不止这些;一定要查阅 SWIG 文档随带的优秀 PDF 文档,以了解更多细节。

参考资料

学习

  • 查阅 SWIG 文档
  • AIX and UNIX 专区:developerWorks 的“AIX and UNIX 专区”提供了大量与 AIX 系统管理的所有方面相关的信息,您可以利用它们来扩展自己的 UNIX 技能。
  • AIX and UNIX 新手入门:访问“AIX and UNIX 新手入门”页面可了解更多关于 AIX 和 UNIX 的内容。
  • AIX and UNIX 专题汇总:AIX and UNIX 专区已经为您推出了很多的技术专题,为您总结了很多热门的知识点。我们在后面还会继续推出很多相关的热门专题给您,为了方便您的访问,我们在这里为您把本专区的所有专题进行汇总,让您更方便的找到您需要的内容。
  • AIX and UNIX 下载中心:在这里你可以下载到可以运行在 AIX 或者是 UNIX 系统上的 IBM 服务器软件以及工具,让您可以提前免费试用他们的强大功能。
  • IBM Systems Magazine for AIX 中文版:本杂志的内容更加关注于趋势和企业级架构应用方面的内容,同时对于新兴的技术、产品、应用方式等也有很深入的探讨。IBM Systems Magazine 的内容都是由十分资深的业内人士撰写的,包括 IBM 的合作伙伴、IBM 的主机工程师以及高级管理人员。所以,从这些内容中,您可以了解到更高层次的应用理念,让您在选择和应用 IBM 系统时有一个更好的认识。
  • 技术书店:在技术书店中浏览有关此主题和其他技术主题的图书。

获得产品和技术

  • 下载 SWIG 的最新版本
  • 免费 试用 IBM 软件。下载一个试用版,登录在线试用版,在沙盒环境中使用产品,或者通过云访问它。有 100 多个 IBM 产品试用版可供选择。

讨论

条评论

developerWorks: 登录

标有星(*)号的字段是必填字段。


需要一个 IBM ID?
忘记 IBM ID?


忘记密码?
更改您的密码

单击提交则表示您同意developerWorks 的条款和条件。 查看条款和条件

 


在您首次登录 developerWorks 时,会为您创建一份个人概要。您的个人概要中的信息(您的姓名、国家/地区,以及公司名称)是公开显示的,而且会随着您发布的任何内容一起显示,除非您选择隐藏您的公司名称。您可以随时更新您的 IBM 帐户。

所有提交的信息确保安全。

选择您的昵称



当您初次登录到 developerWorks 时,将会为您创建一份概要信息,您需要指定一个昵称。您的昵称将和您在 developerWorks 发布的内容显示在一起。

昵称长度在 3 至 31 个字符之间。 您的昵称在 developerWorks 社区中必须是唯一的,并且出于隐私保护的原因,不能是您的电子邮件地址。

标有星(*)号的字段是必填字段。

(昵称长度在 3 至 31 个字符之间)

单击提交则表示您同意developerWorks 的条款和条件。 查看条款和条件.

 


所有提交的信息确保安全。


static.content.url=http://www.ibm.com/developerworks/js/artrating/
SITE_ID=10
Zone=AIX and UNIX
ArticleID=818428
ArticleTitle=开发人员 SWIG 快速入门
publish-date=05282012