We present in this work a parallel algorithm to perform an image template matching (PITM) on simdhypercubecomputers with non-shared local memory. This parallel algorithm is general in the sense that it allows for ar...
详细信息
We present in this work a parallel algorithm to perform an image template matching (PITM) on simdhypercubecomputers with non-shared local memory. This parallel algorithm is general in the sense that it allows for arbitrary dimensions for the image, the template and the hypercube. The flexibility of the PITM algorithm is rooted in the partition of the dimensions of the hypercube into four subsets, each one associated with one independent loop of the sequential algorithm (template matching in the domain of the time), and in the way the data are distributed in the local memories of the processing elements (consecutive storage for the template and for the matrix of cross-correlation coefficients, and shifted-consecutive for the image). Both the algorithmic complexity and the data redundancy are analyzed. In dieser Arbeit wir stellen einen Parallel-Algorithmus vor, der einen Bildmuster-Vergleich (Parallel Image Template Matching, PITM) auf simdhypercube-Rechnern mit gentrennten lokalen Speichern ausführt. Dieser Algorithmus ist allgemein in dem Sinne, daß er beliebige Dimensionen für Bild, Muster und hypercube zuläßt. Seine Flexibilität beruht darauf, daß die hypercube-Dimemsionen in vier Teilmengen aufgeteilt werden, von denen jede einer unabhängigegen Schleife des sequentiellen Algorithmus zugeordnet ist (Mustervergleich im Zeitbereich), und darauf, wie die Daten in den Lokalspeichern der Prozessorelemente verteilt werden (aufeinanderfolgende Speicherung für das Muster und für die Matrix der Kreuzkorrelations-Koeffizienten, versetzt aufeinander-folgend für das Bild). Sowohl die algorithmische Komplexität als auch die Datenredundanz werden analysiert. Nous présentons dans cet article un algorithme à structure parallèle opérant une comparaison d'image avec un gabarit (en anglais parallel image template matching, PITM) sur des ordinateurs hypercubesimd à mémoire locale non-partagée. Cet algorithme parallèle est général dans le sens qu'il autorise des dimensions arbitr
This article presents PFCM, a parallel algorithm for fuzzy clustering of large data sets. Being a generalization of FCM, the algorithm enables arbitrary numbers of data points, features and clusters to be handled cost...
详细信息
This article presents PFCM, a parallel algorithm for fuzzy clustering of large data sets. Being a generalization of FCM, the algorithm enables arbitrary numbers of data points, features and clusters to be handled cost-optimally by hypercube simd computers of arbitrary cube dimension, the only limitation being the size of the local memories of the processors. Speedup responds optimally to enlarging the hypercube. PFCM owes its flexibility to the technique employed in its derivation from the sequential fuzzy C-means algorithm FCM: the association of each of the three dimensions of the problem (numbers of data points, features and clusters) with a distinct subset of hypercube dimensions.
暂无评论