Konstantin Filtschew WebLog

Der tägliche IT-Wahnsinn

Mit ThreadPoolExecutor Arbeit unter Java effizient parallelisieren

Es gibt immer wieder Aufgaben, die sehr lange dauern und sehr große Mengen an Daten verarbeiten müssen. Dabei geht es meistens um Minuten oder gar Stunden, Tage ...

Diese sollten sinnvollerweise parallelisiert werden, um die Leistungs des Systems zu nutzen. Heutige Systeme sind sehr oft Mehrkern- bzw. Mehrprozessorsysteme. Auch ist das GHz-Rennen im Moment zu Ende und die Leistung steigt über die Anzahl der Prozessoren bzw. Kerne.

Das folgende Beispiel zeigt wie man unter Java Aufgaben parallel verarbeiten kann, ohne sich groß den Kopf um die Ausführung zerbrechen zu müssen. Der ThreadPoolExecutor ist meiner Meinung nach eine sehr gute Möglichkeit Aufgaben zu parallelisieren, die Parallel ausgeführt werden können. Der große Vorteil ist, dass er Threads für das Abarbeiten am laufen hält. Das bedeutet bei neuen Aufgaben werden normalerweise keine Threads gestartet und somit entfällt faktisch dieser Overhead. Threads im Pool werden nur beendet, wenn sie länger als der festgelegte Timeout nicht benutzt werden oder sie vom Programmierer explizit beendet werden.

Nicht erschrecken. Das meiste davon sind Kommentare und Beispielcode.

Ich weiß - weniger Gelaber und her mit dem Code!

CODE:
  1. import java.util.concurrent.*;
  2.  
  3.  
  4. class MyThreadPoolExecutor
  5. {
  6.     //Parallel running Threads(Executor) on System
  7.     int corePoolSize = 2;
  8.  
  9.     //Maximum Threads allowed in Pool
  10.     int maxPoolSize = 4;
  11.  
  12.     //Keep alive time for waiting threads for jobs(Runnable)
  13.     long keepAliveTime = 10;
  14.  
  15.     //This is the one who manages and start the work
  16.     ThreadPoolExecutor threadPool = null;
  17.  
  18.     //Working queue for jobs (Runnable). We add them finally here
  19.     final ArrayBlockingQueue<runnable> workQueue = new ArrayBlockingQueue</runnable><runnable>(
  20.             5);
  21.  
  22.     public MyThreadPoolExecutor() {
  23.         threadPool = new ThreadPoolExecutor(corePoolSize, maxPoolSize,
  24.                 keepAliveTime, TimeUnit.SECONDS, workQueue);
  25.     }
  26.  
  27.     /**
  28.      * Here we add our jobs to working queue
  29.      *
  30.      * @param task a Runnable task
  31.      */
  32.     public void runTask(Runnable task) { 
  33.         threadPool.execute(task);
  34.         System.out.println("Tasks in workQueue.." + workQueue.size());
  35.     }
  36.  
  37.     /**
  38.      * Shutdown the Threadpool if it's finished
  39.      */
  40.     public void shutDown() {
  41.         threadPool.shutdown();
  42.     }
  43.  
  44.    
  45.     public static void main(String args[]) {
  46.         MyThreadPoolExecutor mtpe = new MyThreadPoolExecutor();
  47.        
  48.         for (int i= 0; i <6; i++ ) {
  49.             mtpe.runTask(new WorkerRunnable(i));
  50.         }
  51.        
  52.         mtpe.shutDown();
  53.         System.out.println("Finished! :) ");
  54.     }
  55.  
  56.     /**
  57.      * This is the one who do the work
  58.      *
  59.      * This one is static for accessing from main class
  60.      */
  61.     private static class WorkerRunnable implements Runnable {
  62.  
  63.         //so we can see which job is running
  64.         private int jobNr;
  65.        
  66.         /**
  67.          * This is for understanding only
  68.          *
  69.          * @param jobNr number for displaying
  70.          */
  71.         public WorkerRunnable(int jobNr) {
  72.             this.jobNr = jobNr;
  73.         }
  74.        
  75.         @Override
  76.         public void run() {
  77.             for(int i  = 0; i <10; i++) {
  78.                
  79.                 try {
  80.                     System.out.println("Thread "+jobNr+" calculated "+ i);
  81.                     Thread.currentThread().sleep(1000);
  82.                 } catch (InterruptedException ie) {
  83.                     ie.printStackTrace();
  84.                 }
  85.             }
  86.         }
  87.     }
  88. }

Da in diesem Beispiel die Anzahl der Parallel laufender Threads (corePoolSize) auf statisch 2 begrenzt ist, sollte die Zahl über Prozessoranzahl (siehe hier) bestimmt werden. Auch sollte man nicht vergessen die maximale Anzahl an Threads (maxPoolSize) entsprechend anzupassen.

Eine Reaktion zu “Mit ThreadPoolExecutor Arbeit unter Java effizient parallelisieren”

  1. Chris

    Hei Konsi, es ist immer wieder klasse das ich wieder mal auf deine Seite stoße: erst die Handy-Connection, nun die Java-Instruktionen.

    Mal schauen wie gut ich mit den Infos klarkomme, ich habe grade die Aufgabe eine Queue für Aufgaben, die auf einer DB ausgeführt werden, zu implementieren.

    Viele Grüße erstmal!
    chris

Einen Kommentar schreiben

Copyright © 2010 by: Konstantin Filtschew WebLog • Template by: BlogPimp Lizenz: Creative Commons BY-NC-SA.