罗京丽 杜建革
摘 要:量纲误用是科学计算应用程序中一种常见的错误,对计算结果的正确性影响很大。在此提出一种基于模板元编程的量纲检测方法TADA,能够有效完成C和C++程序代码的量纲检测工作。该方法利用程序设计语言自身的模板元编程功能,通过定义相关的量纲模板及其计算和标注方法,依靠编译器在编译期间完成量纲分析和检测,无需任何运行开销,有效解决了传统量纲检测系统中解方程组的计算量瓶颈等问题。
关键词:模板元编程;TADA;量纲;计算量瓶颈
中图分类号:TP393 文献标识码:B 文章编号:1004-373X(2009)04-080-06
Dimensional Unit Analysis Method Based on Template Meta-programming
LUO Jingli1,DU Jiange2
(1.Jiangxi Light Industry College,Yichun,336000,China;2.Nanjing University of Technology,Nanjing,210094,China)
Abstract:Misuse of measurement units is a common mistake in many scientific computing applications.It greatly influences the correctness of the application results.TADA,a tool that effectively detects errors of this kind for C/C++ programs is proposed.Making use of the function of template meta-programming in the language itself,TADA analyses the dimensional units and detects mismatches only by a standard C++ compiler in compile time without any runtime overhead.It avoids the computational bottleneck of solving linear equations introduced by traditional methods.
Keywords:template meta-programming;TADA;measurement unit;computational bottleneck
0 引 言
量纲误用在科学计算程序中是一种常见的错误,然而程序设计语言的标准类型系统却对此无
能为力。物理方程中的量纲错误可以手工分析出来,然而求解物理方程的计算机程序中的量纲错误却难以被发现,因为计算程序往往很复杂。例如,一些研究者认为火星气候探测卫星的丢失,是因为程序中把一个英制单位的变量传递给了使用公制单位的模块[1]。因而,量纲的正确性对计算结果的正确性非常重要。
近年来,研究者们提出了一些量纲检测方法[2-5],典型的如Osprey量纲检测方法[2]。Osprey方法包含5个主要步骤:
(1) 对待检测源程序进行单位标注,使得检测器能够知道每个变量的单位;
(2) C语言解析和语法检查;
(3) 生成包含单位信息的抽象语法树;
(4) 生成约束(方程);
(5) 方程的化简及高斯消去求解(GE)。
可以看出,Osprey方法步骤较多,每步都需要语言外的其他工具,并需要对其进行修改、扩充,而且最后的高斯消去(GE)计算量非常大,是Osprey方法的性能瓶颈。使用Osprey方法还有一个问题,就是需要同时维护2份源代码:一份正常代码用于编译测试;另一份包含量纲信息的检测代码,修改正常代码后必须及时对检测代码进行更新,维护起来也比较繁琐。此外,由于C++语言的解析非常困难,Osprey方法目前没有实现对C++程序的量纲检测。
针对这些问题,提出一种基于模板元编程的量纲检测方法TADA(TMP-bAsed Dimensional Analysis Method),其基本思路是利用程序设计语言自身的模板元编程(Template Meta Programming,TMP)功能,让编译器在编译时对程序中的量纲进行准确性检测,从而可以避免Osprey方法的计算量大等诸多问题。TADA方法具有下列优点:
(1) TADA方法可使得应用开发人员不需要维护2份代码,因为使用TADA方法的检测程序也完全是一个合法的可编译的程序。
(2) TADA方法的量纲检测完全在编译期间进行,对程序不会引入任何运行时开销。
(3) TADA方法无需进行方程组求解工作,可以适用于任何规模的程序。与Osprey等方法类似,TADA方法也需要手工对程序添加量纲信息,其标注的工作量与Osprey等方法相当。但TADA方法中编译器在进行检测的时候无需进行Osprey方法中的方程组求解工作,因而不再有Osprey方法的计算瓶颈。
(4) TADA方法采用模块化设计,使得单位的表示与匹配检测之间实现了松耦合,支持用户可以以一致的方式增加新的单位。
1 模板元编程(TMP)技术
在C++程序设计语言中,模板元编程[6-8]是实现代码重用的一种重要机制。下面首先对模板元编程技术进行介绍,然后给出TADA方法中需要使用的几个基本的模板元程序。
1.1 模板元编程简介
模板可以将类型定义为参数,以提高代码的可重用性。模板包括类模板和函数模板等。函数模板与模板函数的区别可以类比于类与对象的区别:函数模板是模板的定义;而模板函数是函数模板的实例,具有程序代码,占用内存空间。当编译系统发现了函数模板一个对应的函数调用后,根据实参的类型来确认是否匹配函数模板中对应的形参,然后生成一个重载函数,称该重载函数为模板函数。类似地,在声明了一个类模板后,也可以创建类模板的实例—模板类。
类模板的一般形式如下:
template
class 类名{
//类定义…
};
C++的模板系统能够通过模板的特化、偏特化实现逻辑判断,并能通过模板递归实现循环,构成了一个图灵完全的二级语言[6]。使用这种二级语言进行编程叫作C++模板元编程(Template Meta Programming,TMP)。模板元编程的驱动力是模板的递归实例化。下面给出C++模板元编程的一个示例。
首先定义一个类模板,通过该类模板可实现在编译期间计算4的任意次方。如下所示:
pow4.hpp
#ifndef POW4_HPP
#define POW4_HPP
//primary template to compute;
template
class Pow4 {
public:
enum { result = 4 * Pow4
};
//full specialization to end the recursion
template<>
class Pow4<0> {
public:
enum { result = 1 };
};
通过下面的程序来使用该模板。
Test.cpp
#endif // POW4_HPP
#include
#include "pow4.hpp"
int main()
{
std::cout << "Pow4<7>::result = "
<< Pow4<7>::result << '\n';
}
程序Test.cpp执行完后,会正确输出4的7次方的值,该数值是C++编译器在编译模板元程序时递归计算得到。由于模板元程序完全在编译期间执行,相当于对编译器功能进行扩充,因而利用这种程序进行量纲检测具有良好的可行性。
1.2 基本模板元程序
下面给出TADA方法中需要使用的几个基本的模板元程序。
(1) 静态判断
template
struct StaticIF
{
typedef T2 ResultType;
};
template
struct StaticIF
{
typedef T1 ResultType;
};
语法:StaticIF
语义:当cond为真时,ResultType为T1,否则ResultType为T2。
(2) 静态断言
template
template<> void StaticAssert
语法:StaticAssert
语义:当cond为真时什么也不做,否则产生一个编译期错误(UnitError没有定义,或void函数不应该有返回值)。
(3) 静态绝对值
template
struct StaticABS
{
static const int value = n>=0 ? n :-n;
};
语法:StaticABS
语义:n的绝对值,其中n为int类型。
(4) 静态最大公约数
template
struct StaticGCD
{ //b!=0
static const int result = StaticIF<(a,StaticGCD >::ResultType::result;
};
template
{
static const int result=a;
};
语法:StaticGCD::result
语义:递归的使用辗转相除法在编译期间求出a与b的最大公约数,其中a与b为int类型。
2 TADA量纲检测方法
TADA量纲检测方法需要涉及到单位和量纲的表示、计算、标注以及数学运算函数的量纲包装等各个组成步骤,下面将依次对其进行介绍。
2.1 单位和量纲的表示
在Osprey方法中,量纲是用一个长度为7的向量表示的,每个分量对应一个SI标准量纲。TADA方法中也采用了这种方式。为了简化阐述,本文只讨论长度、重量、时间这三种量纲,其SI单位分别为米、千克和秒(TADA方法可直接推广到其他各种量纲)。由于TMP程序的特殊性,它并没有数组或向量的支持,也不能使用浮点数据(使用浮点数表示量纲也会带来不精确性),量纲在TMP程序中的表示形式有所不同:用u11,u12,u21,u22,u31,u32之类的整型量分别表示米u11u12,千克u11u12,秒u11u12,并辅以ratio表示同量纲、不同单位之间的比值,如分钟和秒的比值为60。
TADA方法可静态地建立如下常用单位:
Struct UnitRoot//无量纲
{
static const int u11 = 0;
static const int u12 = 1;
static const int u21 = 0;
static const int u22 = 1;
static const int u31 = 0;
static const int u32 = 1;
static const double ratio;
};
const double UnitRoot::ratio=1;
struct ULength: UnitRoot {}; //长度量纲
struct UWeight: UnitRoot {}; //重量量纲
struct UTime:UnitRoot {}; //时间量纲
struct UAngle:UnitRoot {}; //角的大小(无量纲)
struct UnitLess :UnitRoot {}; //无量纲
struct UMeter:ULength{static const int u11=1;}; //米
struct UKG:UWeight{static const int u21=1;}; //千克
struct USecond:UTime{static const int u31=1;}; //秒
struct UAcceleration:UnitRoot {static const int u11=1;//加速度:米/秒^2
static const int u31=-2;};
struct URadian: UAngle{}; //角度
struct UAngleDegree:UAngle{static const double ratio;}; //弧度
const double UAngleDegree::ratio=180/3.141592653589793;
//弧度与角度的比例
模板元程序在计算公式的时候需要推导出新的量纲,例如在计算“e=12mv2”的时候,编译器应该能根据等号右边的公式计算出它的量纲,并与e的量纲进行比较判别。TADA方法的量纲是用分数形式表示的,在每次量纲计算之后都需要进行分数的约分处理,才能进行相等性判断,因而TADA方法可用如下的方式处理新生成单位,如下所示。
template
struct BuildUnit :public UnitRoot
{
static const int gcd1 = StaticGCD
static const int gcd2 = StaticGCD
static const int gcd3 = StaticGCD
static const int u11 = U11/gcd1;
static const int u12 = U12/gcd1;
static const int u21 = U21/gcd2;
static const int u22 = U22/gcd2;
static const int u31 = U31/gcd3;
static const int u32 = U32/gcd3;
};
2.2 单位和量纲的计算
由于量纲都是用分数表示的,因而其计算会稍有麻烦。下面定义TADA方法中量纲分数的加、减、乘、除和等价测试运算。
(1) 分数的加法运算,如下所示。
template
struct FractionAdd
{
static const int U1=u11*u22+u21*u12;
static const int U2=u12*u22;
};
语法:FractionAdd
语义:分数相加并约分,即:
U1U2=u11*u22+u21*u12u12*u22,且GCD(U1,U2)=1。
(2) 分数的减法运算。
TADA方法通过加法实现减法计算,如下所示。
template
struct FractionSub
{
static const int U1=FractionAdd
static const int U2=FractionAdd
};
语法:FractionSub
语义:分数相减并约分,即:
U1U2=u11*u22-u21*u12u12*u22,且GCD(U1,U2)=1。
(3) 单位相乘。
分别将3个量纲分数相加,然后使用BuildUnit生成新单位。
template
struct UnitMultiply
{
typedef FractionAdd b::u12> FM1; typedef FractionAdd b::u22> FM2; typedef FractionAdd b::u32> FM3; typedef BuildUnit< FM1::U1,FM1::U2, FM2::U1,FM2::U2, FM3::U1,FM3::U2> ResultType; }; 语法:UnitMultiply 语义:单位Ua与单位Ub相乘后的新单位。 (4) 单位相除。 与乘法处理方式相似。 template struct UnitDivide { typedef FractionSub b::u12> FM1; typedef FractionSub b::u22> FM2; typedef FractionSub b::u32> FM3; typedef BuildUnit< FM1::U1,FM1::U2, FM2::U1,FM2::U2, FM3::U1,FM3::U2> ResultType; }; 语法:UnitDivide 语义:单位Ua除以单位Ub后的新单位。 (5) 单位的等价测试函数(宏) #define UNIT_CHECK(a,b) StaticAssert< (a::u11==b::u11) && (a::u12==b::u12) && (a::u21==b::u21) && (a::u22==b::u22) && (a::u31==b::u31) && (a::u32==b::u32)>() 语法:UNIT_CHECK(Ua,Ub); 语义:若单位Ua与单位Ub等价则不产生任何效果,否则产生编译期错误。 2.3 单位和量纲标注的原理和语法 与Osprey等方法类似,TADA方法也在待检测源程序进行单位标注,以使得检测器能够知道每个变量的单位。由于经过单位标注的待检测程序仍然是合法的可编译的程序,所以标注信息必须由语言自身已有的语法要素构成;标注信息还不能影响被标注变量的任何计算特性及使用方式,只有满足这两点要求的标注方式才能使标注工作量最小化。此外,已标注变量应该禁止从未标注变量进行各种隐含的类型转换,这样严格的限制才能有效进行单位量纲的匹配检测。对于C++语言来说,可以采用模板类的方式实现。 标注实质上是把语言原始的数据类型替换成TADA方法预定义的模板类,而模板类实现了各种运算符号的重载,同时禁止了任何隐含的类型转换,使得量纲标注既满足语法要素的要求,又满足计算兼容性的要求和禁止隐含转换的要求。TADA方法中标注的实现如下所示。 template //T为基础变量类型(int、double...) struct UnitBase//U为单位量纲信息 { typedef UnitBase T value; //实际的数值 UnitBase(){} explicit //禁止从基础类型进行隐含构造转换 UnitBase(T init_value):value(init_value){} operator T (){return value;} //允许向基础类型隐含转换 //以下定义各种运算符,使得标注类可以模拟原始变量进行各种运算 #define TEMPLATE template TEMPLATE UnitBase(const UnitBase { UNIT_CHECK(U,U2);//单位等价性检测 value=rhs.value; } TEMPLATE ThisType& operator = (UnitBase { UNIT_CHECK(U,U2); value=rhs.value; return *this; } TEMPLATE bool operator == (UnitBase
{
UNIT_CHECK(U,U2);
return value==rhs.value;
}
TEMPLATE ThisType& operator += (UnitBase
{
UNIT_CHECK(U,U2);
value+=rhs.value;
return *this
}
TEMPLATE ThisType& operator -= (UnitBase
{
UNIT_CHECK(U,U2);
value-=rhs.value;
return *this
}
TEMPLATE ThisType operator + (UnitBase
{
UNIT_CHECK(U,U2);
return ThisType(value+rhs.value);
}
TEMPLATE ThisType operator - (UnitBase
{
UNIT_CHECK(U,U2);
return ThisType(value-rhs.value);
}
TEMPLATE UnitBase
operator * (UnitBase
{
typedef UnitMultiply::ResultType TT;
return UnitBase
}
TEMPLATE ThisType& operator *= (UnitBase
{
UNIT_CHECK(U2,UnitRoot);
value*=rhs.value;
return *this;
}
TEMPLATE UnitBase
operator / (UnitBase
{
typedef UnitDivide::ResultType TT;
return UnitBase
}
#undef TEMPLATE
//以下定义可以显式禁止其他一切引起隐含类型转换的运算
template
template
template
template
template
template
template
(T2 rhs){return UnitError;}
template
};
2.4 定义单位量纲
量纲检测系统应该预定义常用单位量纲,以方便应用开发人员使用。TADA方法采用如下方式定义单位量纲:
{//米
typedef UnitBase
typedef UnitBase
typedef UnitBase
typedef UnitBase
}
namespace KG //千克
{
typedef UnitBase
typedef UnitBase
typedef UnitBase
typedef UnitBase
}
namespace Second//秒
{
typedef UnitBase
typedef UnitBase
typedef UnitBase
typedef UnitBase
}
namespace Acceleration //加速度:米/秒^2
{
typedef UnitBase
typedef UnitBase
typedef UnitBase
typedef UnitBase
}
namespace Radian//弧度
{
typedef UnitBase
typedef UnitBase
typedef UnitBase
typedef UnitBase
}
namespace AngleDegree //角度
{
typedef UnitBase
typedef UnitBase
typedef UnitBase
typedef UnitBase
}
……
2.5 数学运算函数的量纲包装
对于指数、对数、三角函数等已有的数学运算函数,其参数与返回值都是没有单位量纲的,不能直接用于有量纲的公式计算。针对这个问题,TADA方法提供了这些函数的量纲包装,以sqrt和sin为例如下:
#define HALF_UNIT(U) BuildUnit
template
UnitBase U> n) {//开方函数应使单位的所有量纲减半 return UnitBase } #undef HALF_UNIT template UnitBase {//正弦函数的参数应为弧度,返回值为无量纲 UNIT_CHECK(U,URadian); return UnitBase } 2.6 辅助工具 TADA方法还提供了一些辅助工具,用于将量纲变量以适合阅读的方式显示出来,例如: Unit::Second::Double n(10); Unit::Meter::Double m(20); cout< 可以得到这样的输出结果: 0.2米/秒^2 2.7 分析和评估 在TADA方法的基础上,实现了面向C/C++程序的量纲检测系统(TADA系统),并对TADA系统的检测能力进行了分析和评估。 首先采用TADA系统来检测下面的样例程序。 unit.cpp #include "unit.h" using namespace std; int main(int argc,char* argv[]) { Unit::Second::Double n(10); Unit::Meter::Double m(20); Unit::KG::Double c; //示量纲不匹配 c=m/n/n; return 0; } 在TADA系统中,Visual Studio 2003编译该程序会出现类似如下的错误信息,错误信息的第3行就表明了unit.cpp的第9行有错误。 meta_prog_basic.h(15) :error C2065:"UnitError":未声明的标识符 d:\My Documents\Visual Studio Projects\unit\unit_core.h(70) :参见…的引用 d:\My Documents\Visual Studio Projects\unit\unit.cpp(9) :参见…的引用 … 在检测能力方面,采用文献[2]的样例程序对TADA系统和Osprey系统的量纲检测能力进行了对比评估。在文献[2]中,Osprey共找到了3个错误,其中前2个是单位误用错误,第3个是单位转换比例因子错误。TADA系统也完全找到了前2个错误,而第3个错误在标注时被避免掉了,因为该单位系统包含了量纲之间的比例因子,能够进行自动的单位转换。 在性能和可扩展性方面,TADA系统能够更有效地实现对C/C++程序的量纲检测。Osprey系统引入了具有较高计算复杂度的线性方程组求解步骤,需要很大的计算和时间开销来解线性解方程组。TADA系统基于模板元编程技术,只需要利用语言自身的语法能力,靠编译器进行单位量纲检查,没有带来太多额外的复杂计算。并且TADA系统不会带来任何程序的运行时开销。因此TADA系统可适用于各种规模的C/C++程序,具有更好的性能和可扩展性。 在易用性方面,TADA系统的标注负担与Osprey系统相当。由于TADA系统利用C++编译器的功能进行错误检测,而C++编译器遇到模板错误时的错误信息却不很直观,错误报告的可读性较弱,但仍可以快速定位到错误点。 3 结 语 这里提出一种新颖的基于模板元编程的单位量纲检测方法TADA,并基于该方法实现了一个单位量纲检测系统。 TADA方法采用模板元编程技术,使得经过单位量纲标注的受测程序仍然是一个完整、合法、可编译的C/C++程序,无需维护多套程序代码,也无需进行复杂的解方程组运算,就能够在程序代码中发现量纲错误,具有良好的实用性和可扩展性,可以有效适用于多种规模程序的量纲检测。 参 考 文 献 [1]Mars Climate Orbiter Mishap Investigation.ftp://ftp.hq.nasa.gov/pub/pao/reports/1999/MCO_report.pdf. [2]Jiang Lingxiao,Su Zhendong.Osprey:A Practical Type System for Validating Dimensional Unit Correctness of C Programs.Proc.of ICSE′06.Shanghai,2006. [3]Allen E E,Hase D,V.Luchangco,et al.Object-oriented Units of Measurement.Proc.of OOPSLA′04.Canada,2004:384-403. [4]Brown W E.Applied Template Meta-programming in SIUNITS:The Library of Unit-based Computation.http://www.oonumerics.org/tmpwol/brown.pdf,2001. [5]Foster J S,Ahndrich M F,Aiken A.A Theory of Type Qualifiers.Proc.of PLDI′99.Ottawa,1999,34(5):192-203. [6]Todd L Veldhuizen.C++ Templates are Turing-complete.http://osl.iu.edu/~tveldhui/papers/2003/turing.pdf. [7]Micolai Josuttis,David Vandevoorde.C++ Templates:The Complete Guide.Pearson Education,2003. [8]The Boost:MPL Library.http://www.boost.org. [9]Anderson E,Bai Z,Bischof C,et al.LAPACK Users′ Guide.Third Edition.Society for Industrial and Applied Mathematics,1999. [10]Das M,Lerner S,Seigle M.ESP:Path-sensitive Program Verification in Polynomial Time.Proc.of PLDI′02.Ottawa,2002:57-68. [11]Antoniu T,Steckler R A,Krishnamurthi S,et al.Validating the UnitCorrectness of Spread Sheet Programs.Proc.of ICSE′04.Edinburg,2004:439-448. 作者简介 罗京丽 女,1977年出生,江西安福人,江西省轻工高级技校讲师,学士。主要研究方向为计算机软件和计算机应用。 杜建革 男,1973年出生,重庆人,南京理工大学硕士。主要研究领域为计算机软件和计算机应用。 注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文。