WWW.BOOK.DISLIB.INFO
FREE ELECTRONIC LIBRARY - Books, dissertations, abstract
 
<< HOME
CONTACTS



Pages:   || 2 | 3 | 4 | 5 |   ...   | 13 |

«Abschlussarbeit zur Erlangung des Grades eines Master of Sciences (M.Sc.) in Wirtschaftsinformatik der Hochschule Wismar eingereicht von: Ludwig ...»

-- [ Page 1 ] --

Fakultät für Wirtschaftswissenschaften

Master-Thesis

Text Mining als Methode zur Wissensexploration:

Konzepte, Vorgehensmodelle, Anwendungsmöglichkeiten

Abschlussarbeit zur Erlangung des Grades eines

Master of Sciences (M.Sc.)

in Wirtschaftsinformatik

der Hochschule Wismar

eingereicht von: Ludwig Michael Seidel

geboren am 29.12.1964 in Burgstädt

Studiengang Wirtschaftsinformatik

Matrikelnummer: 117520

Erstgutachter: Prof. Dr. Jürgen Cleve Zweitgutachter: Prof. Dr.-Ing. Uwe Lämmel Wismar, den 21. Februar 2013 Inhaltsverzeichnis Inhaltsverzeichnis Abbildungsverzeichnis

Tabellenverzeichnis

Abkürzungsverzeichnis

1 Einleitung

2 Einordnung in die Wirtschaftsinformatik

2.1 Unstrukturierte Daten und Big Data

2.2 Business Intelligence und Text Mining

2.3 Wissensmanagement und Text Mining

2.4 Text Mining im Rahmen weiterer BI Anwendungsdomänen

2.4.1 Competitive Intelligence

2.4.2 Customer Relationship Management

2.4.3 Enterprise Content Management

2.5 Die Bedeutung von Text Mining für das Semantic Web

2.6 Zusammenfassung

3 Grundlagen des Text Mining

3.1 Definitionsansätze des Text Mining

3.2 Geschichte und Interdisziplinarität

3.3 Konzepte im Rahmen des Text Mining

3.3.1 Dokumentensammlung und Dokument

3.3.2 Merkmalsselektion

3.3.3 Benutzeroberfläche

3.4 Modelle zur Vorgehensweise

3.5 Algorithmen und Techniken

4 Anwendungsbereiche von Text Mining

4.1 Themen des Text Mining

4.2 Document Classification

–  –  –

4.3 Document Clustering

4.4 Information Extraction

4.5 Information Retrieval

4.6 Natural Language Processing

4.7 Zusammenfassung

5 Anwendungen

5.1 Dokumentenklassifikation im Rahmen des Wissensmanagement

5.2 Nachrichtenzusammenfassungen durch NewsBlaster

5.3 Automatische Klassifikation von RSS-Feeds für ein Informationsportal.................58

5.4 Anreicherung von Kundenprofilen in der Bankenbranche

5.5 Integration von Text Mining in ein Metriksystem zur Qualitätsbewertung...............62

5.6 Auswerten von Störmeldungen in einem Customer Service Center

5.7 Semantische Suche in Bibliothekskatalogen

5.8 Schneller Zugriff auf relevante medizinische Befunde

5.9 Weitere Einsatzgebiete und Anwendungsbeispiele

6 Fazit und Ausblick

–  –  –

Abbildungsverzeichnis Abbildung 2.1 Geschätzte Wachstumsraten der verschiedenen Datenarten 2007-2010 ([Ru07]).

Abbildung 2.2 Zusammensetzung der Daten im Datawarehouse 2007 und 2010 (geschätzt) 5 Abbildung 2.3 Wachstum der Datenmengen ([UW12], S. 12)

Abbildung 2.4 Welche Informationstechnologien das Big-Data-Phänomen entstehen lassen ([UW12], S. 11)

Abbildung 2.5 Die vier Dimensionen des Big Data ([SSS12], S. 5)

Abbildung 2.6Merkmale von Big Data ([UW12], S. 19)

Abbildung 2.7 Einordnung unterschiedlicher Facetten von Business Intelligence ([Gl01], S. 7)

Abbildung 2.8 Klassifikation von BI Werkzeugen ([Ba06], S. 64)

Abbildung 2.9 Extracting Metadata from content and document management systems ([BK08], S. 139)

Abbildung 2.10 Integrierte Anwendungslandschaft mit traditionellen Systemen und Big Data Lösungen ([UW12], S. 28)

Abbildung 2.11 Softwaresysteme zum WM Prozess

Abbildung 2.12 KM consists of four main perspectives: Consulting, Content/Information, Technology Foundation, and Knowledge Management System (KMS). KMS includes data mining and text mining ([Ch01], S. 4)

Abbildung 2.13 Textdokumente in Kundenbeziehungen ([HR06a], S. 100)

Abbildung 2.14 Dokumentenlebenszyklus ([Bö07], S. 17)

Abbildung 2.15 Struktur für Web3.0 Ressourcen ([Ul10], S. 9)

Abbildung 3.1 A Venn Diagram of the intersection of text mining and six related fields (shown as ovals) ([Mi12], S. 31)

Abbildung 3.2 Example of a visualization tool - mapping concepts (keywords) within the context of categories by means of a category graph ([FS07], S. 11)

Abbildung 3.3 Iterative loop for user input and ouput ([FS07], S. 14)

Abbildung 3.4 Der Prozess des Text Mining ([HR06b], S. 288)

Abbildung 3.5 Text Mining Prozess ([Si06], S. 44)

Abbildung 4.1 Entscheidungsbaum zum Auffinden des Anwendungsbereichs in Hinblick auf Text Ressource und Projektziel ([Mi12], S. 33)

Abbildung 4.2 Beispiel für ein partitionierendes Clustering aus ([Ba13], S. 244)

Abbildung 4.3 Natural language system architecture for text mining for biology ([HW06])....52

iiiAbbildungsverzeichnis

Abbildung 4.4 Visualizing the seven text mining practice areas (ovals) and how specific text mining tasks (labels with ovals) exist at their intersections ([Mi12], S. 38)..........53 Abbildung 5.1 Webportal von KM DocTEr ([KQP03], S. 526)

Abbildung 5.2 Aufruf von NewsBlaster vom 09.02.13 ([Ne13])

Abbildung 5.3 Zielprozess zur automatischen Klassifikation von RSS-Feeds im Überblick ([SS10], S. 98)





Abbildung 5.4 Häufige Terme innerhalb der Daueraufträge ([HR06a], S. 104)

Abbildung 5.5 Die Anreicherung der Kundendatenbank mit extrahierten Termen ([HR06a], S.

106)

Abbildung 5.6 8D Methode zur nachhaltigen Fehlerbeseitigung nach VDA ([UMB10], S.

1103)

Abbildung 5.7 Softwarekonzept von MeSys ([UMB10], S. 1106)

Abbildung 5.8 Ticketerfassung ([SS10], S. 94)

Abbildung 5.9 Suchergebnis für die Eingabe „gone with the wind“ ([BGH12], S. 70)............67 Abbildung 5.10 Ausschnitt aus der elektronischen Krankenakte eines 2 1/2-jährigen Patienten mit über 300 Dokumenten ([HGE07])

–  –  –

Tabellenverzeichnis Tabelle 2.1 Aufgaben des Wissensmanagement

Tabelle 2.2 Fragestellungen der Competitive Intelligence

Tabelle 2.3 Einsatzpotenziale von Text Mining im CRM

Tabelle 3.1 Anwendungsbereiche des Text Mining und ihre Aufgabenstellungen.

............. 28 Tabelle 3.2 In Text Mining verwendete Algorithmen und ihre Anwendungsbebite ([Mi12], S.

34)

Tabelle 4.1 Übersicht über Funktionsbereiche des Text Mining

Tabelle 4.2 Text Mining Themen Anwendungsbereichen zugeordnet nach ([Mi12], S.

34). 42 Tabelle 5.1 Weitere Anwendungsgebiete für das Text Mining

–  –  –

Abkürzungsverzeichnis BI

CE

CI

CRM.................. Custom Relationship Management DM

ECM.................. Enterprise Content Management ETL

HMM................. Hidden Markov Modell HTML................ Hypertext Markup Language IE

IR

KDD.................. Knowledge Discovery in Databases KMS.................. Knowledge Management Systeme LSI

MEMM............... Maximum Entropy Markov Modell ML

NLP

OCR.................. Optical Character Recognition OWL.................. Web Ontology Language PDF

RDF

RSS

SPARQL............ SPARQL Protocol And RDF Query Language SVD

SVM.................. Support Vector Machine TS

WM

XML

–  –  –

"Text ist ein bedeutender Wissensrohstoff, der im Zeitalter des Internet in großen Mengen in digitaler Form zur Verfügung steht. Mit Hilfe von Text Mining kann das in Texten enthaltene Wissen strukturiert und teilweise automatisch extrahiert werden." ([HQW08], S. 1) Die rasch anwachsende Anzahl an Dokumenten und Texten in digitaler Form durch die Anwendung neuer Informationstechnologien (Web 2.0, Mobiles Computing) führt dazu, dass diese digitalen Dokumente immer mehr als Primärmedien für die Verarbeitung, Verbreitung und Verwaltung von Informationen verwendet werden. Ein Großteil der Informationen liegt in Form von Textdokumenten vor. Das Informationszeitalter erleichtert das Speichern von riesigen Datenmengen. Die Vermehrung der Dokumente im Internet, in Firmen Intranets, in News Wires und Blogs ist überwältigend. Obwohl so die Anzahl der zur Verfügung stehenden Daten ständig wächst, bleiben die Möglichkeiten, diese aufzunehmen und weiter zu verarbeiten beschränkt. Suchmaschinen verschärfen dieses Problem zusätzlich, da sie nur durch wenige Eingaben in die Suchmaske eine Vielzahl von Dokumenten zugänglich machen.

Das Wissen über Kunden, Märkte und Wettbewerber wird ein immer wichtigerer Faktor für den Erfolg eines Unternehmens und ist aus dieser Dokumentenbasis zu extrahieren. Das Lesen und Verstehen von Texten zur Wissensgewinnung ist aber eine Domäne des menschlichen Intellekts, allerdings ist dieser kapazitiv beschränkt.

Eine softwaretechnische Analyse durch einen weitgehend automatisierten Prozess der Gewinnung von neuem und potenziell nützlichem Wissen von Textdokumenten kann dieses Manko beseitigen.

Text Mining gewinnt hierbei auf Grund der Fülle und des rasanten Wachstums von digitalen, unstrukturierten Daten immer mehr an Bedeutung. Text Mining ist eine Technik zum Extrahieren von neuem, dem Anwender noch unbekannten Wissen aus Texten und findet überall dort eine Anwendungsmöglichkeit, wo anstelle von in Datenbanken komprimierten, vorselektierten Eingabe von Daten, diese in Textform 1 Einleitung erfasst werden. Text Mining schafft die Möglichkeit, eine effiziente und strukturierten Informations- bzw. Wissensexploration durchzuführen.

Die Methoden des Text Mining mittels statistischer und linguistischer Analyseverfahren bezwecken die Aufdeckung verborgener und interessanter Informationen oder Muster in unstrukturierten Textdokumenten, indem sie zum Einen die riesige Menge an Worten und Strukturen der natürlichen Sprache verarbeiten können und zum Anderen die Behandlung von unsicheren und unscharfen Daten ermöglichen. Nach Feldman/Sanger ist Text Mining als ein neues Forschungsgebiet ein vielversprechender Versuch dieses Problem der Überfrachtung mit Information durch die Verwendung von Techniken des Data Mining (DM), Maschinelles Lernen (ML), Computerlinguistik (Natural Language Processing, NLP), Information Retrieval (IR) und Wissensmanagement zu lösen ([FS07]).

Ziel der Arbeit ist es, den Entwicklungsstand dieser Technologie darzustellen, Anwendungsmöglichkeiten zu erörtern und bereits vorhandene Anwendungen zu zeigen. Dabei liegen die Schwerpunkte sowohl auf den Themen der automatischen Datenvorverarbeitung und Textklassifikation als auch den Mining Methoden wie Klassifikation, Clustering und Informationsextraktion. Es werden die Definition des Text Mining, dessen Einordnung in die Wirtschaftsinformatik, seine Interdisziplinarität und praktische Anwendungsmöglichkeiten betrachtet.

Um dies zu gewährleisten, wird zunächst die Bedeutung des Text Mining im Kontext der Wirtschaftsinformatik dargelegt, unstrukturierte Daten und Big Data unterschieden sowie Business Intelligence und Wissensmanagement in den Diskurs eingeführt. Anschließend werden die Grundlagen des Text Mining in Form von Definitionsansätzen, historischen Betrachtungen, seiner Interdisziplinarität und einigen speziellen Konzepten behandelt und Vorgehensmodelle betrachtet.

Im Kapitel 4 werden verschiedene Themen und Aufgabenstellungen des Text Mining untersucht und unterteilt in Anwendungsbereiche detaillierter vorgestellt. Im nachfolgenden Kapitel werden schließlich Anwendungsmöglichkeiten des Text Mining in Bezug auf die Wirtschaftsinformatik vorgestellt, ehe im 6. und abschließenden Kapitel die wichtigsten Ergebnisse der Arbeit zusammengefasst werden und ein Ausblick auf zu erwartende weitere Entwicklungen des Text Mining im Kontext der Wirtschaftsinformatik gegeben wird.

2 Einordnung in die Wirtschaftsinformatik 2 Einordnung in die Wirtschaftsinformatik Im folgenden Kapitel wird die Bedeutung von Text Mining im Betrachtungsfeld der Wirtschaftsinformatik untersucht. Nach Laudon et al. ist die Wirtschaftsinformatik die "Wissenschaft, die sich mit der Beschreibung, Erklärung, Prognose und Gestaltung rechnergestützter Informationssysteme und deren Einsatz in Wirtschaft, Verwaltung [...] befasst. Sie versteht sich als eigenständiges interdisziplinäres Fach im Wesentlichen zwischen Betriebswirtschaftslehre und Informatik." ([LLS10], S. 62).



Pages:   || 2 | 3 | 4 | 5 |   ...   | 13 |


Similar works:

«Neuerwerbungen im Juli 2014 Fach: Volkswirtschaft Universitätsbibliothek Köln Stand: 31.07.2014, 23:55 Zahl der Neuerwerbungen: 133 ¬The Canadian journal of economics : the journal of the Canadian Economics Association Revue canadienne d'économique. Oxford [u.a.] : Wiley-Blackwell ; New York, NY : JSTOR Nebent.: CJE. Gesehen am 23.01.04. Vorg. -: Canadian journal of economics and political science. 355!URLÄnderung(23-01-04) ISSN 1540-5982 Verfügbarkeit ¬A collection of surveys on market...»

«1265 Discussion Papers Deutsches Institut für Wirtschaftsforschung 2013 Is Smoking Behavior Culturally Determined? Evidence from British Immigrants Rebekka Christopoulou and Dean R. Lillard Opinions expressed in this paper are those of the author(s) and do not necessarily reflect views of the institute.IMPRESSUM © DIW Berlin, 2013 DIW Berlin German Institute for Economic Research Mohrenstr. 58 10117 Berlin Tel. +49 (30) 897 89-0 Fax +49 (30) 897 89-200 http://www.diw.de ISSN print edition...»

«European Integration of Albania: Economic Aspects Elke Thiel Working Paper No. 49 November 2004 b B A M B AMBERG E CONOMIC R ESEARCH GROUP k k* BERG Working Paper Series on Government and Growth Bamberg Economic Research Group on Government and Growth Bamberg University Feldkirchenstraße 21 D-96045 Bamberg Telefax: (0951) 863 5547 Telephone: (0951) 863 2547 E-mail: public-finance@sowi.uni-bamberg.de http://www.uni-bamberg.de/sowi/economics/wenzel/berg ISBN 3-931052-45-1 European Integration of...»

«REGION DU CENTRE-EST BURKINA FASO PROVINCE DU KOULPELOGO COMMUNE RURALE DE DOURTENGA Unité-ProgrèsJustice Financement Coordination technique Bala Wenceslas SANOU Mars 2006 Sommaire Sigles et abréviations AVANT PROPOS INTRODUCTION 1 Contexte et justification de l’élaboration des monographies des communes 2 Objectifs poursuivis à travers l’élaboration des monographies des communes. 6 3 Méthodologie d’élaboration de la monographie communale I. PRESENTATION GENERALE 1.1. Situation...»

«1 November 1, 2005 Economic Aspects of the Right to a Compulsory Portion in the (French and German) Law of Succession Martin Schöpflin∗ 1. Introduction 1.1. The Reason for Carrying out the Study There are only few publications that deal with the economics of the law of succession. One reason seems to be that it is not easy to explain why homo oeconomicus should accumulate property in order to bequeath it to his successors. Emotions play an important role in determining the content of the...»

«TECHNISCHE UNIVERSITÄT MÜNCHEN Fakultät für Wirtschaftswissenschaften Lehrstuhl für Volkswirtschaftslehre – Umweltökonomie und Agrarpolitik Univ.-Prof. Dr. Klaus Salhofer On the Measurement of Efficiency and Productivity Under Firm Heterogeneity Magnus Antonius Kellermann Vollständiger Abdruck der von der Fakultät für Wirtschaftswissenschaften der Technischen Universität München zur Erlangung des akademischen Grades eines Doktors der Wirtschaftswissenschaften (Dr. rer. pol.)...»

«Rahmenkonzept für ein integriertes Geschäftsprozeßmanagement August-Wilhelm Scheer, Markus Nüttgens, Volker Zimmermann* * Prof. Dr. August-Wilhelm Scheer, Dr. Markus Nüttgens, Dipl.-Kfm. Volker Zimmermann, Institut für Wirtschaftsinformatik, Universität des Saarlandes, Im Stadtwald, Gebäude 14.1, DSaarbrücken; {scheer, manue, volker}@iwi.uni-sb; http://www.iwi.uni-sb.de. Stichworte: ARIS, Geschäftsprozeßmanagement, Informationssystem-Architektur, Kontinuierliche Verbesserung,...»

«Historical Trajectories and Corporate Competences in Wind Energy Geoffrey Jones Loubna Bouamane Working Paper 11-112 Copyright © 2011 by Geoffrey Jones and Loubna Bouamane Working papers are in draft form. This working paper is distributed for purposes of comment and discussion only. It may not be reproduced without permission of the copyright holder. Copies of working papers are available from the author. Historical Trajectories and Corporate Competences in Wind Energy* Geoffrey Jones Loubna...»

«Hotel Sonne in KüSnacHt Texte und Bilder zur Geschichte eines Hotels am Zürichsee Texts and photographs of the history of a hotel at the Lake of Zurich Dieses Lesebuch möchte mit Texten und historischen Fotografien Einblicke in die Geschichte des Hotel Sonne vermitteln. Der historische Fokus wird mit thematisch ausgewählten neuen Fotogra­ fien ergänzt, die eine Verbindung zum gegenwärtigen Hotelbetrieb herstellen. This reader wants to give insights into the history of the Hotel Sonne...»

«Gerhard Wegner Vorträge und Podiumsteilnahmen: (ab Beginn des SI in Hannover) 1. 11.11.04 KG Bethlehem, Hannover / Leitung einer Diskussion: „Wohin entwickelt sich die Kirche?“ 2. 27.10.04 KG Neu Wulmstorf/ Vortrag: „Erfolg haben ohne seine Seele zu verkaufen“ 3. 28.10.04 Zeven / Podiumsdiskussion zum Thema Globalisierung und ihre Folgen 4. 22.11.04 EAL Tagung zum Thema: Umsetzung von Hartz IV / Vortrag: „Ist Fordern Fördern?“ und Leitung einer AG: „Einstiegsgeld und...»





 
<<  HOME   |    CONTACTS
2016 www.book.dislib.info - Free e-library - Books, dissertations, abstract

Materials of this site are available for review, all rights belong to their respective owners.
If you do not agree with the fact that your material is placed on this site, please, email us, we will within 1-2 business days delete him.