Christian Siefkes

Welcome to my home page!

I am a computer scientist and an author. Currently, I'm working as a freelance software engineer and specialist for text mining and statistical algorithms in Berlin, Germany. I hold a Ph.D. in computer science from the Freie Universität Berlin.

Books

From Exchange to Contributions

Beitragen statt tauschen

An Incrementally Trainable Statistical Approach to Information Extraction

From Exchange to ContributionsEdition C. Siefkes, Berlin, 2007.

Peer production – the way in which free software projects such as GNU/Linux and free content projects such as the Wikipedia are produced – has revolutionized the areas of software and content production during the last decades. But does peer production only work for information goods, or can it have a similar effect on the production of physical goods?
I have written a book discussing this question, and showing how peer production can indeed grow beyond the sphere of information. A society based entirely on peer production is possible, and this book describes how.

Beitragen statt tauschenAG SPAK Bücher, Neu-Ulm, 2008.

Die deutsche Übersetzung meines Buchs From Exchange to Contributions: das Buch beschäftigt sich dem Potenzial der Peer-Produktion – der Art und Weise wie Freie Software und Freie Inhalte produziert werden. Wir wissen, dass diese neue Produktionsweise von großer Bedeutung ist, wenn es um Software und Inhalte geht – Erfolgsgeschichten wie die von GNU/Linux, Apache oder der Wikipedia sprechen hier eine deutliche Sprache. Aber mein Buch zeigt, dass das noch längst nicht alles ist: Peer-Produktion hat das Potenzial für mehr, bis hin zu einer Umwälzung der gesamten gesellschaftlichen Produktion.

An Incrementally Trainable Statistical Approach to Information
ExtractionVDM Verlag, Saarbrücken, 2008.

My Ph.D. thesis, finished in 2007: The purpose of Information Extraction (IE) is to find desired pieces of information in unstructured or weakly structured texts and store them in a form that is suitable for automatic querying and processing. This book presents a innovative approach to statistical information extraction. It introduces a new algorithm which supports functionality not available in previous IE systems, such as interactive incremental training to reduce the human training effort.
The system also utilizes new sources of information, employing rich tree-based context representations to combine document structure (HTML or XML markup) with linguistic and semantic information. The resulting IE system is designed as a generic framework for statistical information extraction.

What You'll Find on My Site

Free Software

I have contributed to various free software projects, and have also written a few (mostly small) programs of my own. On this page you can also find a list of my translations for the GNU Project and an overview of my experiences in commercial software development.

Free Society

I'm involved in a blog and wiki discussing whether and how the practices of free software and open content development can be extended to other areas of production, and whether an economy based on this mode of production is possible. My research on these questions has lead to a book which is available in English and German. Additionally, this page lists older texts which I wrote as a student, and more.

Spam Filtering

Spam is ubiquitous, highly adapting to any counter-measures, and most annoying. This makes spam filtering one of the most important and interesting research topics in the field of text classification and text mining. Here you'll find my contributions to this effort.

Information Extraction

This page is dedicated to my Ph.D. project. The primary goal of my Ph.D. research was to develop and evaluate a statistical system for the extraction of information from natural language texts that supports incremental training and that takes the structure of texts into account. My Ph.D. thesis, publications, and software are all available here.

History of Computing

As a student I worked for an experimental teaching project with the purpose of giving computer science students a better insight into how to write good papers and to conduct larger research activities. As the topic area of the project we had chosen historical developments in the fields of computer science and software development; both to open up an interesting field of exploration that is largely outside the scope of usual CS teachings and to provide the students with a better understanding of the history of their own field.

Contact

How to get in touch with me.

Keimform Articles

I'm a co-author in the German-language Keimform-Blog, a group weblog discussing whether and in which ways commons-based peer production has a potential that extends beyond the areas of free software and open content production where it has first emerged. Here you can preview my most recent contributions and the latest articles published in the blog by any author.

My Most Recent Articles

Oya: Wovon wir alle leben

Christian Siefkes, 05 Mar 2010

Der Gemeingüter-Virus greift weiter um sich. Die neue Zeitschrift Oya widmet sich in ihrer ersten Ausgabe dem Thema „Allmende, Gemeingüter, Commons – Wovon wir alle leben“. Das auch grafisch sehr ansprechend gestaltete Magazin hat dabei ein umfangreiches und tiefschürfendes Programm zusammengestellt. Die unermüdliche Silke Helfrich führt in den Schwerpunkt ein und erklärt „Was Gemeingüter sind und [...]

Gemeingüterreport: Wohlstand durch Teilen

Christian Siefkes, 15 Feb 2010

Silke Helfrich, Rainer Kuhlen, Wolfgang Sachs und ich haben ein kleines Buch – einen Report – geschrieben. Es geht darin – wieder einmal – um die Gemeingüter. Während Silkes letztes Buchprojekt zum Thema (in dem ich mit einem Beitrag [PDF] vertreten bin) recht dick und wissenschaftlich ausgefallen ist, ging es uns diesmal um eine leicht [...]

The Earth’s the Limit (1)

Christian Siefkes, 09 Feb 2010

The vision of post-scarcity is a popular but controversial meme in the debates of peer production. Post-scarcity envisions a world where everything is free as in free beer, where no payment or accounting is requirement for anything you use. Post-scarcity ideas usually rely very strongly on advanced technology, postulating that almost everything can be automated—or [...]

Copyleft für Hardware – ein kniffliges Problem

Christian Siefkes, 30 Dec 2009

[This article is also available in English.] Das Copyleft hat beim Erfolg Freier Software eine wichtige Rolle gespielt. Copyleft stellt sicher, dass alle Versionen einer Software bzw. eines Dokuments frei bleiben. Es hindert Firmen daran, »verbesserte« Versionen eines Freien Programms zu privatisieren und als proprietäre Software zu verkaufen. Die erste und bekannteste Copyleft-Lizenz ist die GNU [...]

The Tricky Business of “Copylefting” Hardware

Christian Siefkes, 09 Dec 2009

[Diesen Artikel gibt es auch auf Deutsch.] It’s probably safe to say that the copyleft principle has been essential for the success of free software. Copyleft means that all versions of a software or document will remain free, preventing companies from creating “value-added” versions of free programs and selling them as proprietary, non-free software. The GNU [...]

Von kopierbaren Dingen, offenen Produktionsstätten und berührbaren Bits

Christian Siefkes, 02 Dec 2009

Das Projekt »Tangible Bit« (»berührbares Bit«) will für materielle Produkte möglich machen, was für Freie Software schon geht: jede/r soll sie sich problemlos besorgen können, jede/r soll sich an ihrer Weiterentwicklung und Verbesserung beteiligen können, und jede/r soll sie an andere weitergeben und mit anderen teilen können Wenn ich (z.B. bei einem Freund) eine Software sehe, [...]

Newest Blog Articles

Tim Berners-Lee on mashups with open data

StefanMz, 09 Mar 2010

The inventor of WWW and HTML, Tim Berners-Lee, shows mashups using open data, e.g. OpenStreetMap after the earth quake in Haiti. Der Erfinder von WWW und HTML, Tim Berners-Lee, zeigt Mashups mit offenen Daten, z.B. OpenStreetMap nach dem Erdbeben in Haiti.

Oya: Wovon wir alle leben

Christian Siefkes, 05 Mar 2010

Der Gemeingüter-Virus greift weiter um sich. Die neue Zeitschrift Oya widmet sich in ihrer ersten Ausgabe dem Thema „Allmende, Gemeingüter, Commons – Wovon wir alle leben“. Das auch grafisch sehr ansprechend gestaltete Magazin hat dabei ein umfangreiches und tiefschürfendes Programm zusammengestellt. Die unermüdliche Silke Helfrich führt in den Schwerpunkt ein und erklärt „Was Gemeingüter sind und [...]

Peter Linebaugh: Some Principles of the Commons

StefanMz, 01 Mar 2010

[Deutsche Version beim CommonsBlog] Reposted from counterpunch Human solidarity as expressed in the slogan “all for one and one for all” is the foundation of commoning.  In capitalist society this principle is permitted in childhood games or in military combat. Otherwise, when it is not honored in hypocrisy, it appears in the struggle contra capitalism or, as [...]

George Clooney als homo oeconomicus in der Krise

benni, 28 Feb 2010

Gestern habe ich “up in the air” gesehen. Ein Film, der mich ähnlich ratlos hinterlassen hat, wie Antje, wenn auch aus anderen Gründen. (Spoilerwarnung: Wer den Film noch sehen mag und nicht mit Spoilern leben kann, sollte vielleicht nicht weiterlesen). Ich glaube zunächst mal im Gegensatz zu Antje, dass es in dem Film nicht primär darum [...]

Nur Denken oder Essen?

ulifrank, 26 Feb 2010

Zwei Menschen können wohl den selben Gedanken denken, aber nicht dasselbe Stück Brot essen Dieses Zitat von Thomas Hobbes (aus: Leviathan – mit dem er den „Kampf aller gegen alle“ begründet, siehe auch das Bild rechts, zum Vergrößern klicken) wird einem immer wieder entgegen gehalten, wenn man von dem Modell der Freien Software als „Keimform“ einer [...]

Delivered in Beta

StefanMz, 23 Feb 2010

Great video on openness, open design, and sharing — created during the Open Design Workshop at the Betahaus as part of Social Media Week Berlin 2010 [via]. Delivered in Beta from KS12 on Vimeo.


[Last generated: 2010-03-10] Valid XHTML 1.0 Transitional