Introduction
- LAMBDA Project (Webinar 1)
- Learning Big Data Analytics
- Knowledge Repository
- Lectures
- Tools
- Activities
- Big Data Analytics Summer School 2019
- Big Data Analytics Summer School 2020

LAMBDA - Learning, Applying, Multiplying Big Data Analytics
Specific Objectives
OBJ 1: Strategic Partnership - Establishment and development of productive and fruitful long-term cooperation that continues after project completion |
•4 partners, 3 different countries (Serbia, Germany, UK) |
OBJ 2: Boosting scientific excellence of the linked institutions and capacity building of the widening country and the region in Big Data Analytics and semantics |
•Different capacity building activities (Big Data Analytics Summer School) |
OBJ 3: Spreading excellence and disseminating knowledge throughout the West Balkan and South-East European countries |
•5 workshops at International conferences in the region |
OBJ 4: Sustainability of research related to key societal challenges (sustainable transport, sustainable energy, security, societal wellbeing) and financial autonomy in the long run |
•7 brainstorming sessions on key societal challenges |








Join Us





ENTERPRISE INFORMATION SYSTEMS
Department Introduction


Agenda














1.2. Important Facts about EIS
~35 Employees, including 1 professor, 8 postdocs,
13 PhD students, 7 software developers, 2 business developers, etc.
8 Customers since 2016
(1 as Coordinator;lots of coordination experience)
Big Data Value AssociationIndustrial Data Space Association









2. Products and Services
2.1. VoCol - Vocabulary-based Data Integration

2.2. Federated Hybrid Search Engine



2.3. AskNow - Question Answering System




3. Research Projects (Public Funding)








IAO, IESE, IML, IOSB, IPA, ISST, SIT
groups, 18 use cases




THANK YOU


Smart Data Analytics
Research Group Overview
Sub-groups








Lectures Presentation
(University of Bonn & Fraunhofer)
Lectures at BDA School
Lectures at BDA School
Lectures at BDA School
LAMBDA Bonn Key Contacts





Introduction
- Data on the Web
- Linking Data on the Web
5 Stars

Uvod
Naziv predmeta: Semantičke Veb tehnologije
Predavanje br. 1
Nastavna jedinica: Uvod u Semantički Veb
Nastavna tema: Istorija Semantičkog Veba
Pripremila: Dr Valentina Janev
Istorija Semantičkog Web-a
- 1989: Web je “izumeo” Tim Berners-Lee (između ostalih), fizičar koji je radio u CERN-u (Evropska organizacija za nuklearno istraživanje)
- 1994: W3C je formiran (Predsednik Tim Berners-Lee)
- Kao forum za informacije, trgovinu, komunikaciju i kolektivno razumevanje sa ciljem da vodi Web do njegovog punog potencijala
- Da razvije zajedničke protokole koji će unaprediti njegovu evoluciju i osigurati njegovu interoperativnost
- 2001: Berners-Lee, T., Hendler, J., Lassila, O., Semantic Web, Scientific American, May 2001.
Ciljevi
- Berners-Lee, T., Hendler, J., Lassila,
Scientific American, May 2001 - Semantički Web je proširenje postojećeg web-a, gde informacije imaju precizno definisano značenje, što će omogućiti bolju saradnju između računara i korisnika.
- Cilj Semantičkog Web-a je stvoriti mrežu (Web of data) koja ima organizovanu, zajedničku semantiku koja je pristupačna, jasna i lako upotrebljiva za softverske agente.

Ciljevi
- Imati informacije na Webu čije značenje je razumljivo i računarima
- Imati trilione malih specijalizovanih softverskih agenata koji pomažu u automatskom izvršavanju zadataka koristeći se raspoloživim informacijama na Webu
- Ovo otvara nove perspektive za prikupljanje i inženjering znanja
Title
- Text bullet 1
- Text bullet 2
Međunarodni konzorcijum W3C
- obezbeđuje osnovnu informacionu infrastrukturu, povezujući ljude i organizacije širom sveta
- nastoji da uspostavi interoperabilnost i univerzalni pristup Webu uvođenjem otvorenih standarda za osnovne Web alate – nezavisno od pojedinačnih interesa
- funkcioniše zahvaljujući prihodima od članarine, a ima oko 400 članova među kojima su vodeće komercijalne kompanije u ovoj oblasti, kao i brojne profitne i neprofitne organizacije, univerziteti i pojedinci – eksperti
- nadgleda i koordinira Projekat semantičkog Web-a
- The World Wide Web Consortium develops interoperable technologies (specifications, guidelines, software, and tools) to lead the Web to its full potential.

Semantic Web Layered Cake (2008)
Standardne tehnologije:
- RDF – Resource Description Framework
- RDFS – RDF Schema
- OWL – Web Ontology Language
- SPARQL – RDF Query Language

Semantic Web Layered Cake (2008)
Unicode |
|
XML |
|
RDF |
|
RDFS |
|
Ontologije |
|
Logika i dokaz |
|
Poverenje |
|
Zablude o Semantičkom Web-u
Zabluda 1: Semantički Web pokušava da nametne značenje „s vrha”
- Odgovor 1: Jedino značenje koje OWL i RDF(S) nameću je značenje veznika u jeziku, koji korisnici mogu da koriste da bi izrazili svoje sopstveno značenje.
Zabluda 2: Semantički Web zahteva da se svi slože oko jednog predefinisanog značenja za izraze koje koriste.
- Odgovor 2: Moto Semantičkog Web-a nije nametanje jedinstvene ontologije. Njegov moto je pre: „dozvolimo hiljadama ontologija da se razvijaju”. To je upravo i razlog zbog koga je mapiranje među ontologijama osnovna tema u zajednici Semantičkog Web-a.
Izvor: Frank van Harmelen, Istraživanje semantičkog veba 2006. godine: glavni tokovi, popularne zablude, trenutno stanje i budući izazovi.
Zablude o Semantičkom Web-u
Zabluda 3: Semantički Web će od korisnika zahtevati da razumeju komplikovane detalje formalizovane reprezentacije znanja.
- Odgovor 3: Zaista, pojedini delovi osnovne tehnologije semantičkog Web-a se oslanjaju na komplikovane detalje formalizovane reprezentacije znanja. ...za većinu korisnika (sadašnjih i budućih) semantičkog Web-a, takvi detalji će u potpunosti biti „sakriveni”, kao što su komplikovani detalji CSS-a i (X)HTML-a sakriveni na postojećem Webu.
Izvor: Frank van Harmelen, Istraživanje semantičkog veba 2006. godine: glavni tokovi, popularne zablude, trenutno stanje i budući izazovi.
Zablude o Semantičkom Web-u
Zabluda 4: Korisnici semantičkog Web-a će morati da izvrše ručno označavanje svih postojećih Web stranica.
- Odgovor 4: … aplikacije semantičkog Web-a se uzdaju u masovnu automatizaciju za izdvajanje takvih semantičkih oznaka iz samih izvora. …podaci su već dostupni u (polu)strukturiranim formatima i često su već organizovani shemama baza podataka, što može da obezbedi potrebnu semantičku interpretaciju.
Izvor: Frank van Harmelen, Istraživanje semantičkog veba 2006. godine: glavni tokovi, popularne zablude, trenutno stanje i budući izazovi.
Razvoj Web-a prema Semantičkom Webu
Pregled razvoja Web-a, Nova Spivack, Radar Networks, 2008

Razvoj Web-a prema Semantičkom Webu
“ Semantički Web obuhvata četiri faze razvoja interneta:
- Web 1.0, koji se odnosi na povezivanje informacija
- Web 2.0 predstavlja povezivanje ljudi.
- Web 3.0, koji upravo počinje ... i predstavlja povezivanje znanja
- Web 4.0 koji će doči kasnije ... i predstavlja povezivanje inteligencije u sveprisutan Web gde će ljudi i stvari moći da rezonuju i zajedno komuniciraju.”
Pregled razvoja Web-a, “Semantic Wave 2008” , Mills Davis
Web 1.0
- Statičke HTML strane umesto dinamičkog, od strane korisnika definisanog sadržaja
- - Lične Web strane, prezentacije preduzeća
- Korišćenje framesetova
- Online knjiga posetilaca
- URL - Uniform Resource Locator
Web 2.0 – Social Web
- Novi socijalni fenomen:
- blogovi, wiki, označavanje, folksonomije
- Novi korisnički interface:
- AJAX
- Novi oblici podataka
- mikroformat, RSS, "mash-ups"
- Nove aplikacije/ arhitekture:
- Web servisi, SOA
Web 2.0
- Web 2.0 prvi su upotrebili i kao koncept definisali Tim O’Reilly i Dale Dougherty, 2004. godine
- Karakteristike Web 2.0:
- Omogućava da se posebnim uslugama zadovolje potrebe velikog broja malih korisničkih grupa,
- prikupljanje kolektivnog znanja, koje ne mora biti eksplicitno iskazano, već se u velikom broju slučajeva koriste postojeći društveni odnosi i veze,
- mrežni efekti, odnose se pre svega na sinergetske efekte aktivnog učešća većeg broja korisnika pri kreiranju sadržaja,
- baze podataka sastavljene na osnovu doprinosa korisnika
Web 3.0 – Semantic Web
- Podaci predstavljeni pomoću formalne sematike:
- RDF, OWL, SPARQL, RIF
- Spontana integracija informacija
- Semantički Web servisi, agenti
- Naglasak na otvorenim standardima
Overview
- Definitions
- IAIS Definition
- UOXF Definition
- OntoText Definition
- TIB Definition
Title
- Text bullet 1
- Text bullet 2
Title
- Text bullet 1
- Text bullet 2
Introduction to Big Data & Architectures
About us


Smart Data Analytics (SDA)
SDA Group Overview

SDA Group Overview
Dr. Damien Graux
University of Bonn


Computer Science Institute

Dr. Hajira Jabeen
Projects — EU H2020
Software Projects
Distributed Semantic Analytics

What is BigData?
Big Data
Big Data landscape (2012)




Big Data Ecosystem
File system | HDFS, NFS |
Resource manager | Mesos, Yarn |
Coordination | Zookeeper |
Data Acquisition | Apache Flume, Apache Sqoop |
Data Stores | MongoDB, Cassandra, Hbase, Hive |
Data Processing | |
●Frameworks | Hadoop MapReduce, Apache Spark, Apache Storm, Apache Flink |
●Tools | Apache Pig, Apache Hive |
●Libraries | SparkR, Apache Mahout, MlLib, etc |
Data Integration | |
●Message Passing ●Managing data heterogeneity | Apache Kafka SemaGrow, Strabon |
Operational Frameworks | |
●Monitoring | Apache Ambari |
Cluster Basics
Big Data Architectures
Architectures
Lambda Architecture
Three layers
Lambda Architecture


Kappa Architecture
Microservice Architecture
Microservice Architecture
Distributed Kernels
Distributed Kernels
Distributed Kernels



YARN (Yet Another Resource Manager)
YARN (Yet Another Resource Manager)

Apache Mesos
Zoo Keeper
Distributed File Systems
Distributed File Systems



Hadoop
Hadoop, Why?
Components
Hadoop Distributed File System
Hadoop Distributed File System
HDFS Architecture

NameNode
DataNode
Block Placement
Hadoop Distributed File System
Summary
Next
References
Thank you !
Distributed Big Data Frameworks
A Panorama

THANK YOU !
Database Paradigms
Database Paradigms
Relational (a quick reminder)
Relational (a quick reminder)

Database Paradigms
Key-Value stores
Key-Value stores

Database Paradigms
Document databases
Document databases

Database Paradigms
Wide Column stores
Database Paradigms
Graph databases
Selected Storage Systems
MongoDB

What is MongoDB great for?

Apache Hive

Apache Hive - Limitations

Apache Cassandra

Cassandra - Strenghts

Cassandra - Limitations

Distributed Stream Processing
Apache Kafka

Apache Kafka

Search, Indexing, visualization
ElasticSearch

ElasticSearch

Visualization
Kibana

Kibana

Processing Frameworks
Analytic Frameworks



Hadoop MapReduce

Map reduce

Processing of Map tasks

Visualizing map and reduce tasks
Example: Word counting in class
Drawbacks of MapReduce
Requirement . .
Apache Flink

Apache Flink APIs
Apache Flink Layered APIs

Apache Flink Libraries
References
Distributed Big Data Library
Apache Spark
Shortcomings of Mapreduce

Apache Spark
Introduction to Spark
Introduction to Spark
Data Frames
Real-time processing
Single JVM
(Standalone, Mesos, YARN)
docker-compose
Machine Learning
Graph processing


