Popis: |
Ziel des vorgestellten Projekts war, das Merkmal Vollzeit/Teilzeit des Tätigkeitsschlüssels in den Integrierten Erwerbsbiografien der Bundesagentur für Arbeit zu korrigieren. Dies sollte mithilfe des auch in der Verdienststrukturerhebung vorhandenen, aber manuell korrigierten Schlüssels erfolgen. Unter Berücksichtigung verschiedener projektspezifischer Anforderungen wurde ein überwachtes maschinelles Lernverfahren eingesetzt, welches das entsprechende Merkmal eines Beschäftigten anhand vorliegender Betriebs- und Mitarbeitermerkmale schätzen kann. Es zeigte sich, dass sich mit diesem Modell der Fehler in der Signierung des Tätigkeitsschlüssels bei einer aus dem Datensatz der Verdienststrukturerhebung erzeugten Testmenge um etwa 40 % reduzieren lässt. The aim of this project was to correct the “part-time/full-time” variable component of the occupational code number in the Integrated Labour Market Biographies of the Federal Employment Agency. The basic idea was to use the code number which is also employed in the structure of earnings survey but corrected manually. Against the background of various project-specific requirements, a supervised machine learning method was applied which can estimate the relevant variable for an employee based on the variables available for the local unit and the employee. A test of the model on a data subset of the structure of earnings survey showed that it can reduce the coding error in the occupational code number by about 40 %. |