من یک سری تابع در محیط پایتون نوشتم که حالا میخوام با استفاده از پردازش موازی CUDA سرعت کارم رو بالا ببرم. با توجه به اینکه توابعی که دارم پیچیده هستن و نمیتونم همون کد رو در kernel به زبان c بنویسم، سوالم اینه که آیا امکانش هست بتونم توابع نوشته شده رو داخل kernel فراخونی کنم و ازشون استفاده کنم؟
همه آموزش هایی که در مورد برنامه نویسی پردازش موازی خوندم با ساده ترین مثال ممکن آموزش دادن و هیچکدوم چنین چیزی رو در نظر نگرفتن. ممنون میشم اگه راهنماییم کنین