Ряд малоизвестных мелочей для широкого круга пользователей
1. Да, аппаратное ускорение сделано через CUDA. CUDA отдельно качать не надо при использовании последних версий драйверов GeForce.
2. Да, можно указать конкретную видеокарту для физики, но не в SLI режиме, читайте Programming Guide, глава 3.2. Но в Windows Vista к указанной карте должен быть подключен монитор (скоро ограничение уберут, смельчаки могут попробовать новую бета-версию CUDA). В режиме SLI физика, вероятно, считается только на первой карте тандема (мастер-карте).
3. Нет, прибавки производительности/качества в нынешних играх не ждите. Производительность скорее убавится, а качество ищите с микроскопом (взрывы, водопады, отлетающие в мир иной враги).
4. Нет, 3D Mark 2006 не использует аппаратное ускорение в тесте CPU. Там используется Software библиотека. Вот Vantage - использует.
Как понять, насколько видеокарта "потянет" физику?
Факт первый - для CUDA вычислительные ресурсы графического процессора выделяются т.н. мультипроцессорами. Один мультипроцессор содержит 8 универсальных шейдерных процессоров. Минимальная ставка, таким образом, 8 шейдерных процессоров, независимо от того, насколько мала "физическая" нагрузка. Таким образом, включая PhysX для видеокарты вроде GeForce 8400 и запуская игру с поддержкой, из 16 процессоров половина сразу кладется на алтарь ускорения физики и для графики остается только 8. По некоторым прикидкам, для соответствия производительности расчета физики оригинальному AGEIA PPU, в зависимости от уровня compute capability (см. ниже), требуется использовать два-три мультипроцессора (16-24 шейдерных). В свете этого нет никакого смысла включать PhysX для карты низшего и среднего диапазона, где и для графики шейдерной мощности не хватает. Это же останавливает внедрение PhysX в гейминдустрии - рассчитывая на минимальные конфигурации, выбор между ухудшением графики с ускорением физики или графикой поприличнее с расчетом физики на CPU очевиден.
Факт второй - для CUDA критичны объем и полоса пропускания видеопамяти. Видимо из-за этого минимальным объемом для включения PhysX установлено 256 Мб (оригинальные карты на базе AGEIA PPU имели 128 Мб выделенной памяти). Имеет смысл посмотреть загрузку видеопамяти выбранной игрой с помощью RivaTuner для оценки доступности памяти для физических вычислений. Для расчетов физики нужна большая полоса пропускания к памяти, CUDA также очень любит гонять память большими кусками. У карт на базе AGEIA PPU полоса пропускания к памяти составляла 23 Гб/с, для сравнения, карты 8600 GT имеют полосу пропускания видеопамяти 22 Гб/с для всего (графики и физики). Для интегрированных решений PhysX станет последним гвоздем в крышку гроба.
Факт третий - графические процессоры NVIDIA разных лет выпуска имеют различные способности по неграфическим вычислениям. Называется это compute capability, уровни имеют вид 1.Х. Чем выше уровень, тем больше выход флопсов и потоков на мультипроцессор и еще кой-какие преимущества добавляются. Описания уровней смотрите в вышеупомянутом Programming Guide который можно найти на сайте nzone.com/object/nzone_physxgames_home.html, быстренько посмотреть поддерживаемый процессором уровень можно в сравнительных таблицах видеокарт которых можно найти --> nvidia.com/object/cuda_learn_products.html.
Вывод: про карты низшего уровня и интегрированные решения лучше забыть вообще, карта среднего уровня сгодится лишь как dedicated для физики, на старых топах на базе G80 физика отъест больше шейдерных процессоров.