CBLAS编译安装与使用举例

在Github上看到有人用BLAS library优化自己的源码,对此产生了强烈兴趣。

准备自己动手实践一下,网上搜索了一大堆编译安装BLAS教程的资料,没一个靠谱的,编译过程中遇到一堆的问题。因为自己没有root权限,所以只能在home目录中本地编译使用cblas,然后本地链接编译得到的库文件到应用程序。

最后自己凭着直觉连蒙带猜,终于把BLAS与CBLAS装上,并投入到实例中优化运行应用程序。填补了很多Linux知识。 

首先要解释一下BLAS,CBLAS与LAPAXK之间的区别与联系。

BLAS(Basic Linear Algebra Subprograms)库,是用Fortran语言实现的向量和矩阵运算库,是许多数值计算软件库的核心, 但也有一些其它的包装, 如cblas是C语言, 也有C++的包装, boost/ublas 是C++ template class的实现; 另外还有一些特别的实现, 如intel MKL, AMD core math library blas就是做向量、矩阵的基本运算,如加、减、乘等操作。

CBLAS是BLAS的C语言接口。

LAPACK(Linear Algebra PACKage)库,是用Fortran语言编写的线性代数计算库,包含线性方程组求解(AX=b)、矩阵分解、矩阵求逆、求矩阵特征值、奇异值等。该库用BLAS库做底层运算,许多高层的数学库都用BLAS和LAPACK做底层。 

CBLAS只是BLAS的C语言版本,所以CBLAS安装需要先装BLAS

安装步骤

1. 编译blas,进入BLAS目录执行下面的命令

gfortran -c  -O3    *.f                # 编译所有的 .f 文件,生成 .o文件 
    ar rv libblas.a      *.o                # 链接所有的 .o文件,生成 .a 文件 

2. 编译cblas,进入CBLAS目录,首先根据自己的操作系统平台,将某个Makefiel.XXX复制为Makefile.in,XXX表示操作系统。如果是Linux,那么就将Makefile.LINUX 复制为 Makefile.in。

cp ../BLAS/libblas.a  testing  # 将上一步编译成功的 libblas.a 复制到 CBLAS目录下的testing子目录 
    make                                            # 编译所有的目录 

此时会在CBLAS安装目录下的lib目录中产生一个静态链接库文件cblas_LINUX.a,这个库文件和上面得到的libblas.a文件就是我们所需要的。另外还需要的就是CBLAS/include中的cblas.h头文件。将三个文件全部拷贝到,你需调用的应用程序源码目录中。

到此BLAS和CBLAS的安装任务完成,可以看出,这里安装的实际含义是编译得到两个库文件和一个头文件,再将这三个文件放置到gcc的搜索路径中去(例如可以在拷贝到/esr/local/lib,或在/usr/local/lib下做一个快捷链接,也可直接像我上面那样复制的)。

cd /usr/local/lib
ln -s  ./CBLAS/lib/cblas_LINUX.a  ./libcblas.a

简单运用

CBLAS/BLAS分为3个level,level1是用于向量的计算,level2是用于向量和矩阵之间的计算,level3是矩阵之间的计算。比如计算矩阵的乘法就是属于level3,这里就用矩阵乘法来学习使用CBLAS。

计算矩阵乘法的函数之一是 cblas_sgemm,使用单精度实数,另外还有对应双精度实数,单精度复数和双精度复数的函数。在此以 cblas_sgemm为例。

函数定义为:

void cblas_sgemm ( const enum CBLAS_ORDER Order, const enum CBLAS_TRANSPOSE TransA,
                                   
                                        const enum CBLAS_TRANSPOSE TransB, const int M, const int N,

const int K, const float alpha, const float *A,

const int lda, const float *B, const int ldb,

const float beta, float *C, const int ldc  )

此函数计算的是 C = alpha*op( A )*op( B ) + beta*C,

const enum CBLAS_ORDER Order,这是指的数据的存储形式,在CBLAS的函数中无论一维还是二维数据都是用一维数组存储,这就要涉及是行主序还是列主序,在C语言中数组是用行主序,fortran中是列主序。我还是习惯于是用行主序,所以这个参数是用CblasRowMajor,如果是列主序的话就是CblasColMajor。

const enum CBLAS_TRANSPOSE TransA和 const enum CBLAS_TRANSPOSE TransB,这两个参数影响的是op( A )和op( B),可选参数为CblasNoTrans=111, CblasTrans=112, CblasConjTrans=113,其中TransA = CblasNoTrans, op( A ) = A,TransA = CblasTrans, op( A ) = A',TransA = CblasConjTrans, op( A ) = A'。 TransB类似。

const int M,矩阵A的行,矩阵C的行
const int N,矩阵B的列,矩阵C的列
const int K,矩阵A的列,矩阵B的行
const float alpha, const float beta,计算公式中的两个参数值,如果只是计算C=A*B,则alpha=1,beta=0

const float *A, const float *B, const float *C,矩阵ABC的数据

计算两个简单矩阵的乘法。
A:
1,2,3
4,5,6
7,8,9
8,7,6
B:
5,4
3,2
1,0

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/76711e9223fc70f893ce4a70531d95e2.html