如何访问C中的(动态分配的)Fortran数组



dlsym fortran2003 (2)

在我看来,尝试访问Fortran库中的全局数据并不是一个好习惯。 它可以使用COMMON块完成,但它们是邪恶的,需要静态大小的数组。 一般来说,存储关联是一件坏事。

切勿以“__bar_MOD_a”的形式访问模块符号,它们是编译器特有的,不能直接使用。 使用函数和子例程传递poiters。

将数组作为子例程参数传递。 您也可以在C中分配数组并将其传递给Fortran。 还可以做的是获得一个指向数组的第一个元素的指针。 它将用于指向数组的C指针。

我的解决方案,为了简单没有.so,添加它是微不足道的:

bar.f90

module bar
 use iso_C_binding

implicit none

integer, parameter :: pa = selected_real_kind(15, 307)

real(pa), dimension(:), allocatable,target :: a
integer :: as

contains

subroutine allocArray(asize,ptr) bind(C,name="allocArray")
    integer, intent(in) :: asize
    type(c_ptr),intent(out) :: ptr

    as = asize
    allocate(a(asize))

    ptr = c_loc(a(1))
end subroutine

subroutine fillArray(values) bind(C,name="fillArray")
    real(pa), dimension(as), intent(in) :: values

    a = values
end subroutine

subroutine printArray()  bind(C,name="printArray")

    write(*,*) a
end subroutine

end module

main.c中

#include <dlfcn.h>
#include <stdio.h>

int main()
{
int i, k = 4;
double arr[k];
char * e;
double *a;
void allocArray(int*,double**);
void fillArray(double*);
void allocArray();


for(i = 0; i < k; i++)
    arr[i] = i * 3.14;

allocArray(&k,&a);
fillArray(arr);
printArray();
for(i = 0; i < 4; i++)
    printf("%f ", a[i]);
printf("\n");

return 0;
}

编译并运行:

gcc -c -g main.c

gfortran -c -g -fcheck=all bar.f90

gfortran main.o bar.o

./a.out
0.0000000000000000        3.1400000000000001        6.2800000000000002        9.4199999999999999     
0.000000 3.140000 6.280000 9.420000 

注意:在Fortran子程序中没有任何理由返回,它们只是掩盖了代码。

https://ffff65535.com

我的主要问题是,为什么数组做这样的奇怪的事情,是否有任何办法在“干净​​”的方式做下列事情。

我目前有一个C程序foo.c通过dlopen/dlsym连接一个Fortran程序bar.f90 ,大致如下面的代码所示:

foo.c的:

#include <dlfcn.h>
#include <stdio.h>

int main()
{
int i, k = 4;
double arr[k];
char * e;

void * bar = dlopen("Code/Test/bar.so", RTLD_NOW | RTLD_LOCAL);

void (*allocArray)(int*);
*(void **)(&allocArray) = dlsym(bar, "__bar_MOD_allocarray");
void (*fillArray)(double*);
*(void **)(&fillArray) = dlsym(bar, "__bar_MOD_fillarray");
void (*printArray)(void);
*(void **)(&printArray) = dlsym(bar, "__bar_MOD_printarray");
double *a = (double*)dlsym(bar, "__bar_MOD_a");

for(i = 0; i < k; i++)
    arr[i] = i * 3.14;

(*allocArray)(&k);
(*fillArray)(arr);
(*printArray)();
for(i = 0; i < 4; i++)
    printf("%f ", a[i]);
printf("\n");

return 0;
}

bar.f90:

module bar

integer, parameter :: pa = selected_real_kind(15, 307)
real(pa), dimension(:), allocatable :: a
integer :: as

contains

subroutine allocArray(asize)
    integer, intent(in) :: asize

    as = asize
    allocate(a(asize))

    return
end subroutine

subroutine fillArray(values)
    real(pa), dimension(as), intent(in) :: values

    a = values
    return
end subroutine

subroutine printArray()
    write(*,*) a
    return
end subroutine

end module

运行主要收益率

0.0000000000000000        3.1400000000000001        6.2800000000000002        9.4199999999999999     
0.000000 -nan 0.000000 0.000000 

这表明Fortran正确分配数组,甚至正确存储给定的值,但不能通过dlsym访问(处理该数据导致段错误)。 我也试过这个固定大小的数组 - 结果保持不变。

有没有人知道这种行为的原因? 我个人认为,事情要么是双向的,要么是根本就不是 - 这个“Fortran接受C语言的数组,反之亦然”,让我怀疑我是否以这种方式从C访问数组时遇到了一些基本的错误。

另一个(甚至更重要的)问题是,如何做这样的“正确的方式”阵列访问。 目前我甚至不确定是否坚持“Fortran as .so”界面是一个好方法 - 我认为在这种情况下也可以尝试混合编程。 尽管如此,数组的问题仍然存在 - 我读到,这可以通过ISO C绑定以某种方式解决,但我不知道如何,但(我还没有与Fortran工作过很多,但特别是没有说绑定) ,所以在这个问题上的帮助将不胜感激。

编辑:

好吧,我读了一下ISO C Binding,发现了一个非常有用的方法。 使用C_LOC我可以得到我的Fortran结构的C指针。 不幸的是,指向数组的指针似乎是指向指针的指针,需要在C代码中取消引用,或者类似于C数组。

编辑:

让我的程序现在使用C绑定方式弗拉基米尔F指出,至少在大多数情况下。 C文件和Fortran文件现在链接在一起,所以我可以避免libdl接口,至少对于Fortran部分 - 我仍然需要加载一个动态的C库,获取一个函数指针指向其中的一个符号,并通过作为指向Fortran的函数指针,后者将其称为计算的一部分。 由于上述函数需要double * s [数组],所以无法用C_LOC来传递我的Fortran数组,奇怪的是C_LOC(array)C_LOC(array(1))将正确的指针传递回C函数。 array(1)虽然做了伎俩。 可悲的是,这不是“最干净”的方式。 如果有人给我提示如何使用C_LOC函数做到这一点,那就太好了。 尽管如此,我接受弗拉基米尔F的答案,因为我认为这是更安全的解决方案。


许多Fortran编译器在内部使用了一种称为数组描述符的结构,即保存数组形状的结构(即每个维度的大小和范围以及指向实际数据的指针)。 它允许像假设形状的数组参数,数组指针和可分配数组的工作的实现。 您通过__bar_MOD_a符号访问的是可分配数组的描述符,而不是其数据。

数组描述符是特定于编译器的,而依赖于特定描述符格式的代码是不可移植的。 示例描述符:

请注意,即使是那些特定于这些编译器的某些版本。 例如,英特尔声明其当前描述符格式与英特尔Fortran 7.0中使用的格式不兼容。

如果你看两个描述符,你会发现它们更接近,第一个元素是一个指向数组数据的指针。 所以你可以很容易地读取数据使用double **而不是double *

double **a_descr = (double**)dlsym(bar, "__bar_MOD_a");
...
for(i = 0; i < 4; i++)
    printf("%f ", (*a_descr)[i]);

再一次,这是不可移植的,因为这些描述符的格式将来可能会改变(尽管我怀疑数据指针会被移到别的地方而不是描述符的开头)。 有一个试图统一所有描述符格式的规范草案,但不清楚它将如何以及何时被不同的编译器厂商采用。

编辑:这里是如何使用访问器函数,它使用ISO_C_BINDING模块中的C_LOC()来可移植地获取指向可分配数组的指针:

Fortran代码:

module bar
  use iso_c_binding
  ...
  ! Note that the array should be a pointer target
  real(pa), dimension(:), allocatable, target :: a
  ...
contains
  ...

  function getArrayPtr() result(cptr)
    type(c_ptr) :: cptr

    cptr = c_loc(a)
  end function

end module

C代码:

...
void * (*getArrayPtr)(void);
*(void **)(&getArrayPtr) = dlsym(bar, "__bar_MOD_getarrayptr");
...
double *a = (*getArrayPtr)();
for(i = 0; i < 4; i++)
    printf("%f ", a[i]);
...

结果:

$ ./prog.x
   0.0000000000000000        3.1400000000000001        6.2800000000000002
 9.4199999999999999
0.000000 3.140000 6.280000 9.420000




fortran-iso-c-binding