GPU 问题和限制
您在特定的系统环境或配置中可能遇到的已知问题或限制。
应注意,对于图形处理单元 (GPU) 存在少量限制。
- 撤销的数组
- 在 GPU 上对反向数组(例如
[5,4,3,2,1])执行排序操作比在 CPU 上速度要慢。 - 分段违例
- 在某些情况下,会出现分段违例。 要避免这些错误,请通过指定 -Xmso3m 选项,将本机堆栈大小设置为 3 MB。
- 初始排序操作缓慢
- 测试表明在 GPU 上执行的第一项排序操作的速度可能比后续的排序操作要慢。
- CUDA4J 模块中发生间歇性崩溃
- 在工作负载较重的情况下,CUDA4J 模块中会发生间歇性崩溃,这将导致出现分段错误(显示
vmState=0x00000000)。 出现这一问题的根本原因正在调查中。 - 同时运行 CUDA4J 和 sort 操作
- 在多线程环境中,同时运行 CUDA4J 和 GPU sort 操作可能会导致应用程序挂起。 这一问题正在调查中。