热卖商品
新闻详情
CUDA测试程序错误 - osc_kpp7htz3的个人空间 - OSCHINA - 中文...
来自 : 开源中国
发布时间:2021-03-25
相关BUG查询网址
Some Methods以下参考网址
打开对应文件libs.py、nvvm.py:
def get_libdevice(arch): libdir = (os.environ.get(\'NUMBAPRO_LIBDEVICE\') or os.environ.get(\'NUMBAPRO_CUDALIB\')) pat = r\'libdevice\\.%s(\\.\\d+)*\\.bc$\' % arch candidates = find_file(re.compile(pat), libdir) return max(candidates) if candidates else Nonedef get_cudalib(lib, platform=None): if lib == \'nvvm\' and os.environ.get(\'NUMBAPRO_NVVM\'): return os.environ.get(\'NUMBAPRO_NVVM\') libdir = os.environ.get(\'NUMBAPRO_CUDALIB\') candidates = find_lib(lib, libdir, platform) return max(candidates) if candidates else None
加入对应环境变量后,复制D:\\Anaconda3\\pkgs\\cudatoolkit-9.0-1\\DLLs(当前电脑CUDA的安装路径)目录下的libdevice.10.bc文件的为libdevice.computeXX.10.bc(当前为libdevice.compute50.10.bc),放在当前文件夹下。配置结束后,运行结果如下:
告警相关:
def _compute_thread_per_block(kernel, tpb): if tpb != 0: return tpb else: try: tpb = kernel.autotune.best() except ValueError: warnings.warn(\'Could not autotune, using default tpb of 128\') tpb = 128 return tpb
2018年7月8日加入对应环境变量后,复制D:\Anaconda3\pkgs\cudatoolkit-9.0-1\DLLs(当前电脑CUDA的安装路径)目录下的libdevice.10.bc文件的为libdevice.computeXX.10...def,cuda,autotune,osc_kpp7htz3,,CUDA测试程序错误 - osc_kpp7htz3的个人空间,OSCHINA博客CUDA测试程序运行错误 Code 代码 1 import numpy as np 2 from timeit import default_timer as timer 3 from numba import vectorize 4 5 @vectorize(["float32(float32, float32)"], target='cuda') 6 def vectorAdd(a, b): 7 return a + b 8 9 def main(): 10 N = 320000 11...CUDA测试程序错误
本文链接: http://procudan.immuno-online.com/view-762491.html
发布于 : 2021-03-25
阅读(0)
最新动态
2021-03-25
2021-03-25
2017-07-29
2021-03-25
2021-03-25
2021-03-25
2021-03-25
2021-03-25
2021-03-25
2021-03-25
2021-03-25
2021-03-25
联络我们