Data Mining

London Financial Studies

Programbeskrivelse

Les den offisielle beskrivelsen

Data Mining

London Financial Studies

Populariteten til datavitenskapsteknikker som data mining og maskinlæring har vokst enormt de siste årene. De presenterer effektive løsninger for å behandle og analysere den enorme mengden data som er tilgjengelig for risikostyrere og finansielle analytikere.

Med fremskritt i databehandlingskraft og distribuert prosessering, er det nå mulig å behandle - og gi mening om - den enorme mengden informasjon som kan samles fra flere forskjellige datakilder.

Dette praktiske programmet dekker nøkkelteknikker - inkludert flere aspekter av overvåket og ikke-overvåket maskinlæring - som kan brukes ved gruvedrift av økonomiske data. Programmet fokuserer også på avanserte datavitenskapsteknikker som blir mye brukt på finansielle markeder for tekstanalyse og kunstig intelligens: Natural Language Processing (NLP) og Deep Learning (DL).

Programmet leveres helt gjennom workshops og casestudier. Deltakerne lærer å implementere naturlige språkbehandlingsteknikker ved å bygge en sentimentanalysemodell for å analysere tekststrenger. I den dype læringsdelen vil deltakerne fokusere på bygging og testing av et neuralt nettverk for å løse et økonomisk problem ved hjelp av Python.

De fleste øvelser og casestudier er illustrert i Python, slik at du kan lære å jobbe med dette fleksible programmeringsspråket.

Dato: 21.-23. November 2018

Sted: Central London

Avgift: £ 1325 per dag

Du kan være kvalifisert for fortrinnsrett. Ta kontakt med oss ​​for å sjekke om firmaet ditt er medlem av LFS Global Client Program.


Hvem kurset er for

  • Porteføljeforvaltere
  • Risikobestyrere
  • Profesjonelle ønsker å introdusere data-mining konsepter i deres daglige oppgaver
  • IT-utviklere
  • statistikere
  • Quant analytikere
  • Finansingeniør
  • konsulenter


Læringsmål

  • Bygg en solid kunnskapsbase om data mining teknikker og verktøy, samt deres søknad til finansindustrien
  • Få praktisk erfaring med naturlig språkbehandling og dyp læring i økonomi
  • Lær hvordan du bruker Python til data mining og behandling, og for å løse real-world NLP og DL problemer
  • Få en forståelse av algoritmer for kunstig neural nettverk (ANN) og hvordan du bruker dem til å designe, bygge og utvikle DL-modeller


Tidligere kunnskap

  • Grunnleggende oppfatninger av statistikk
  • God kunnskap om Excel
  • Ingen forkunnskaper om Python er nødvendig


Kursplan

Dag en

Oversikt over Data Mining

Legge ut de ulike komponentene i data mining

  • Foreningsregler
  • Klassifisering vs regresjonsproblemer
  • Clustering analyse

Datavisualisering

  • Oversikt over tredjepartsløsninger (Tableau, QlikeTech, etc.) for visualisering av store datamengder. Case-studier vil bli utarbeidet ved hjelp av matplotlib-bibliotek og plotting (open-source online data-samarbeid plattform)
  • Grafiske databaser: Bruk av nettverksteori til porteføljeanalyse og introduksjon til grafiske databaser
  • Outlier deteksjon
  • Mahalanobis Avstand

regresjon

  • OLS (vanlige minstefirkanter)
  • Ridge regresjon
  • sparsity
  • Lasso
  • Elastisk nett

Workshop: Utarbeide den optimale sikringen av en stor eiendomsportefølje ved bruk av futures. Porteføljen har en global karakter (100 aksjer), men bare et begrenset sett med futures er tilgjengelig

Hovedkomponentanalyse (PCA)

  • Hovedkomponentanalyse av termens strukturstruktur og implisitte volatiliteter
  • Hovedkomponentregresjon (PCR)
  • Delvis minste kvadrater (PLS)

Workshop: Bruke PCA for å redusere dimensjonaliteten til et stort datasett av historiske rentekurver. Den komplekse oppførselen til denne kurven er spredt over ulike løpetider, og denne teknikken tillater en risikostyring å ha en mye bedre oversikt over dynamikken i rentekurver

Dataklassifisering - Regresjon

Kjerneldensitet Estimering og klassifisering

  • Kjernel tetthets estimering er en ikke-overvåket læringsprosedyre, noe som fører til en enkel familie av prosedyrer for ikke-parametrisk klassifisering

Case Study: Bruke kjerner til å utlede sannsynlighetsfordelinger for økonomiske data

Klassifisering - Del I

  • Naive Bayes klassifisering: En enkel og kraftig teknikk for å klassifisere data

Case Study: Utarbeide en Bayes-prediktor for et stort datasett som inneholder forskjellige attributter av amerikanske banker. Bayes-klassifiseringen vil bli brukt til å skille de bankene som sannsynligvis vil mislykkes fra de som skal forbli løsemiddel

Klassifisering - Del II

  • Robust data mining teknikker
  • Logistisk regresjon

Case Study: Bruke loggregresjon på et ekte datasett med høy dimensjonalitet

Dag to

Dataklassifisering (forts.)

Klassifisering - Del III

  • Klassifisering Trær: CART-modellering fører til brukervennlige praktiske beslutningstrener
  • Konseptet med beslutningstrender vil bli utvidet med teknikker som Random Forest and Bagging

Case Study: Begreper som kostnadsfunksjoner, urenhetsnivåer, trebeskjæring og kryssvalidering vil bli håndtert i detalj

  • K-Nærmeste nabo læring
  • Logistisk regresjon

Case Study: Klassifiseringsmetodene (K-Nærmeste og CART) kommer til å bli satt på jobb på ulike tekniske indikatorer (RSI, MACD, etc.) av store sett med virkelige økonomiske data. Dette vil illustrere hvordan disse klassifiseringene kan brukes til å skille lagre i forskjellige skuffer i henhold til styrken av forskjellige egenskaper på en rask måte

Workshop: Data mining verktøy

En introduksjon til Python - Et kraftig programmeringsspråk

Anvendelsen av Python i dataanalysen vil bli illustrert gjennom praktiske eksempler med fokus på maskinlæring ved hjelp av "scikit-learn" -pakken. Alle eksempler vil bli dekket i Jupyter-notatbøker. Delegater vil lære å bygge egendefinerte rapporter i Python

Dag tre

Naturlig språkbehandling

Utdrag av ekte verdi fra sosiale medier, bilder, e-post, PDF-filer og andre kilder til ustrukturert data er en stor utfordring for bedrifter.

Denne delen er viet til anvendelsen av Natural Language Processing (NLP) for å trekke ut verdien fra ustrukturert data. Flere virkelige eksempler på å undersøke ustrukturert data i økonomi - inkludert sentimentanalyse av økonomiske nyheter - vil bli utforsket.

Workshop: Bruke NLTK-pakken med Python til:

  • Utforsk og tilkjenne en tekst ved hjelp av Tf-Idf og Count-vektorer
  • Forutsi ord i en tekst: bygge et ordsprog som starter fra en tekst; skriver et program som kan forutsi ordet som følger et gitt ord
  • Forstå følelsen av et nyhetsartikkel på et bestemt lager

Deep Learning

Deep Learning som en delfelt av maskinlæring - Artificial Neural Networks (ANN) algoritmer.

  • Introduksjon til Deep Learning
  • Forward forplantning
  • Word2vec tilnærming
  • Dypere nettverk og videreformidling
  • Optimalisering av neuralt nettverk med tilbaketrukket forplantning

Case Study: Bygg en Deep Learning-modell med Python (med fokus på Keras og Tensorflow-pakkene)

Denne skolen tilbyr programmer i:
  • Engelsk


Sist oppdatert August 9, 2018
Varighet og pris
Dette kurset er Campusbasert
Start Date
Studiestart
April 10, 2019
Nov. 2019
Duration
Varighet
3 dager
Heltidsstudier
Price
Pris
3,975 GBP
£ 1325 per dag
Information
Deadline
Locations
Det forente kongerike Storbritannia og Nord-Irland - London, England
Studiestart : April 10, 2019
Søknadsfrist Kontakt skolen
Studieslutt April 12, 2019
Studiestart : Nov. 2019
Søknadsfrist Kontakt skolen
Studieslutt Kontakt skolen
Dates
Videoer

LFS Webcast series - Applying Data-Mining in Finance