Large Scale Support Vector Machines


The Large Scale SVM project is an on-going collaboration between the Lehrstuhl Computergestützte Statistik, Technische Universität Dortmund and the research group Theory of Machine Learning Institut für Neuroinformatik, Ruhr-Universität Bochum. Both universities are members of the UA Ruhr.

Current project staff members are  

Prof. Dr. Claus Weihs
Jun.-Prof. Dr. Tobias Glasmachers
Prof. Dr. Bernd Bischl
Dr. Aydin Demircioglu
M. Sc. Daniel Horn
B. Sc. Jakob Richter
B. Sc. Hanna Houphouet

tu do
We are gratefully funded by the Mercator Research Center Ruhr (Mercur)


Machine Learning is concerned with algorithmic and statistical aspects of automated training of adaptive predictive models from data. Learning systems have entered industrial applications as well as the analysis of scientific data on a grand scale.

Support Vector Machines (SVMs) and kernel-based methods in general are well established for their accurate predictions, their statistical properties, and their high flexibility. One of their main disadvantages is high training complexity, which renders exact modeling of large data bases impractical. Resorting to simpler (e.g., linear) models for algorithmic reasons is to be avoided from a statistical point of view. In contrast, large data sets are an ideal prerequisite for training high-quality non-linear models without restrictive assumptions. Numerous approximate training schemes have been proposed for making non-linear SVMs applicable to large amounts of data. These approaches, in contrast to exact SVM models, are neither fully developed nor well understood from a learning and complexity theoretical point of view.

The project aims at closing this gap. The project partners will investigate the relationship of training time and statistical guarantees, relying on empirical as well as formal methods. We are conducting a comparison of different approximative SVM solvers. This will shed light on the trade-offs of the different methods. In addition new Methods will be developed and analyzed. The resulting insights and algorithms will be applied to relevant large-scale learning problems in the areas of astrophysics, medical imaging, driver assistance systems, and sports analytics.



All of our experiments are conducted in R using several toolboxes, many of them were developed at our institute.

mlr is an R package that allows to conduct machine learning problems

mlrMBO is an R package that builds upon the power of mlr and provides easy model-based optimization.

SHARK is a fast, modular, feature-rich open-source C++ machine learning library. It provides methods for linear and nonlinear optimization, kernel-based learning algorithms, neural networks, and various other machine learning techniques.

SharkSVM is a simple command-line wrapper for Shark.

For our experiments we transformed several publicly available datasets. You can find most of them (with the exception of the private data of our partners) on github.


We are happy to work with you on your large scale data. We have on going collaborates with

  • Icecube
  • Lehrstuhl für Photonik und Terahertztechnologie (RUB)


Jun.-Prof. Dr. Tobias Glasmachers
Institut für Neuroinformatik
Ruhr-Universität Bochum
44780 Bochum
Phone: +49 234 32-25558
Fax: +49 234 32-14210
E-Mail: tobias.glasmachers /at/


Institut für Neuroinformatik
Ruhr-Universität Bochum
44780 Bochum
Phone: +49 234 32-201
Fax: +49 234 14-201
E-Mail: aydin.demircioglu /at/

Die Ruhr-Universität ist eine Körperschaft des Öffentlichen Rechts. Sie wird durch ihren Rektor Herrn Prof. Dr. Elmar W. Weiler gesetzlich vertreten.
Zuständige Aufsichtsbehörde ist das Ministerium für Innovation, Wissenschaft und Forschung des Landes Nordrhein-Westfalen, Völklinger Straße 49, 40221 Düsseldorf.
Umsatzsteuer-Identifikationsnummer: DE 127 056 261

Inhaltliche und technische Verantwortung für diese Seiten:
Aydin Demircioglu
Institut für Neuroinformatik
Ruhr-Universität Bochum
Universitätsstraße 150
Building NB, Room 3/26
Phone: +49-234-32-27974
D-44780 Bochum
aydin.demircioglu /at/

Alle Rechte vorbehalten. Die auf der Website verwendeten Texte, Bilder, Grafiken, Dateien usw. unterliegen dem Urheberrecht und anderen Gesetzen zum Schutz des geistigen Eigentums. Ihre Weitergabe, Veränderung, gewerbliche Nutzung oder Verwendung in anderen Websites oder Medien ist nicht gestattet.

Für Vollständigkeit, Fehler redaktioneller und technischer Art, Auslassungen usw. kann keine Haftung übernommen werden. Insbesondere kann keine Gewähr für die Vollständigkeit und Richtigkeit von Informationen übernommen werden, die über weiterführende Links erreicht werden. Anbieter sind für die eigenen Inhalte, die sie zur Nutzung bereithalten, nach den allgemeinen Gesetzen verantwortlich. Verweise durch Hyperlinks auf Inhalte fremder Websites dienen lediglich der Information. Die Verantwortlichkeit für diese fremden Inhalte liegt alleine bei dem Anbieter, der die Inhalte bereithält. Es kann daher auch keine Gewähr für die Vollständigkeit und Richtigkeit von Informationen übernommen werden, die über weiterführende Hyperlinks erreicht werden. Hinsichtlich sämtlicher Links auf diesen Seiten betonen wir, dass wir keinen Einfluss auf die Gestaltung und die Inhalte der durch Link von unserer Website aus erreichbaren Seiten anderer Anbieter haben und uns deren Inhalt nicht zu eigen machen. Diese Erklärung gilt für alle Seiten dieser Website und die dort angebrachten Links.

Legal Notice: The Ruhr-Universität holds the copyright of all text, images, and layout of its official web presence, i.e. of all content of the pages within the central Ruhr-Universität WWW server with domain name Copying and altering the contents of any of these pages is permitted only with the expressed permission of the Ruhr-Universität. Saving copying of web pages on a personal computer for the purpose of viewing with a browser is permitted. All other content of pages on the Ruhr-Universität WWW server is the editorial responsibility of the respective faculties, institutes, departments or units. The Ruhr-Universität accepts no liability, within the bounds of law, for the content of its web presence or for any third party pages given by links on its pages. The Ruhr-Universität expressly distances itself from the content of any linked pages and does not consider these pages to be its own.
Back to top