Citeseer/Multi-GPU Island-Based Genetic Algorithm for Solving the Knapsack Problem (2012) 10.1.1.261.450 — различия между версиями

Материал из DISCOPAL
Перейти к: навигация, поиск
(Новая страница: «{{checked|}} {{citeseerlink|citeseer/Multi-GPU Island-Based Genetic Algorithm for Solving the Knapsack Problem (2012) 10.1.1.261.450|<html> </html>}} {{enddiv}}…»)
 
 
(не показаны 4 промежуточные версии 2 участников)
Строка 1: Строка 1:
 
{{checked|}}
 
{{checked|}}
{{citeseerlink|citeseer/Multi-GPU Island-Based Genetic Algorithm for Solving the Knapsack Problem (2012) 10.1.1.261.450|<html>
+
{{citeseerlink|citeseer/Multi-GPU Island-Based Genetic Algorithm for Solving the Knapsack Problem (2012) 10.1.1.261.450|
 +
Представлена новая реализация генетического алгоритма с использованием кластера с несколькими графическими процессорами.
 +
Предложенная реализация использует островной генетический алгоритм, в котором каждый GPU развивает один остров.
  
 +
Особи обрабатываются с помощью CUDA варпов, что позволяет решать большие ранцы и устраняет нежелательную дивергенцию потоков.
 +
MPI интерфейс MPI используется для обмена генетическим материалом между изолированными островами и сбора статистических данных. 
 +
Характеристики предложенных ГА исследуются на двухузловом кластере, состоящем из 14 графических процессоров Fermi и 4 шестиядерных процессоров Intel Xeon. Общая общая производительность GPU предложенного ГА достигает 5,67 TFLOPS.
 +
}}
  
</html>}}
 
 
{{enddiv}}
 
{{enddiv}}
  
 
[[Категория:CiteSeerArticles]]
 
[[Категория:CiteSeerArticles]]

Текущая версия на 07:05, 24 марта 2022

«

Представлена новая реализация генетического алгоритма с использованием кластера с несколькими графическими процессорами. Предложенная реализация использует островной генетический алгоритм, в котором каждый GPU развивает один остров.

Особи обрабатываются с помощью CUDA варпов, что позволяет решать большие ранцы и устраняет нежелательную дивергенцию потоков. MPI интерфейс MPI используется для обмена генетическим материалом между изолированными островами и сбора статистических данных. Характеристики предложенных ГА исследуются на двухузловом кластере, состоящем из 14 графических процессоров Fermi и 4 шестиядерных процессоров Intel Xeon. Общая общая производительность GPU предложенного ГА достигает 5,67 TFLOPS.

…»