Sources
http://flic.kr/p/6nuBHD (originally from slide slide No title)

IBM 1620 เครื่องประมวลผลข้อมูล, 1962




Sources
http://flic.kr/p/dRiWjB (originally from slide slide No title)

เว็บ

เว็บมาพร้อมกับการเปลี่ยนแปลงจากอุตสาหกรรมต่อสังคมข้อมูลและให้โครงสร้างพื้นฐานที่มีคุณภาพใหม่ของการจัดการข้อมูลเกี่ยวกับการซื้อกิจการเช่นเดียวกับการจัดเตรียม

  • พร้อมใช้งานสูง
  • ความเกี่ยวข้องสูง
  • ค่าใช้จ่ายต่ำ



เว็บแทรกเข้ามาในสังคม

  • การติดต่อทางสังคม (แพลตฟอร์มเครือข่ายทางสังคม, บล็อก, ... )
  • เศรษฐศาสตร์ (ซื้อ, การโฆษณา, การขาย, ... )
  • การบริหาร (eGovernment)
  • ชีวิตการทำงาน (รวบรวมข้อมูลและการแบ่งปัน)
  • สันทนาการ (เกมเล่นบทบาท, ความคิดสร้างสรรค์, ... )
  • การศึกษา (eLearning, เว็บเป็นระบบข้อมูล, ... )


เว็บปัจจุบัน

ที่ประสบความสำเร็จอย่างกว้างขวาง
  • จำนวนมากของข้อมูลและข้อมูล
  • มาตรฐานไวยากรณ์สำหรับการถ่ายโอนข้อมูลที่มีโครงสร้าง
  • เครื่อง processable เอกสารที่มนุษย์สามารถอ่านได้
แต่:
  • เนื้อหา / ความรู้ที่ไม่สามารถเข้าถึงได้โดยเครื่อง
  • ความหมาย (ความหมาย) ของข้อมูลที่ถ่ายโอนไม่สามารถเข้าถึงได้

Sources

ข้อ จำกัด ของเว็บ

ข้อมูลที่มากเกินไปกับโครงสร้างน้อยเกินไปและทำให้การบริโภคของมนุษย์
  • การค้นหาเนื้อหาเป็นง่ายมาก
  • อนาคต→ต้องใช้วิธีการที่ดีกว่า
เนื้อหาของเว็บที่ต่างกันคือ
  • ในแง่ของเนื้อหา
  • ในแง่ของโครงสร้าง
  • ในแง่ของการเข้ารหัสอักขระ
  • อนาคต→ต้องบูรณาการข้อมูลที่ชาญฉลาด
มนุษย์สามารถได้รับข้อมูลใหม่ (โดยปริยาย) จากชิ้นส่วนที่กำหนดของข้อมูลบนเว็บ แต่ปัจจุบันเราสามารถจัดการกับไวยากรณ์
  • →ต้องใช้เทคนิคเหตุผลอัตโนมัติ


สิ่งที่ Google ไม่พบ

มีข้อมูลจำนวนมากต้องการเครื่องมือค้นหาในปัจจุบันไม่สามารถตอบสนองคือ:
  • อพาร์ทเมนให้เช่าใกล้กับร้านอาหารที่ดีจัดอันดับไทย
  • สองภาษาการดูแลเด็กภาษาอังกฤษเยอรมันในกรุงเบอร์ลินในสามารถเข้าถึงได้ 15 นาทีจากสถานที่ของฉันของการทำงาน
  • เด็กที่เป็นมิตรสถานที่ท่องเที่ยวกับกิจกรรมวัฒนธรรมและการกีฬา
  • นักวิจัยที่ทำงานอยู่ในเอเชียตะวันออกเฉียงใต้ในหัวข้อการดึงข้อมูล
  • ผู้ให้บริการ ERP ที่มีสำนักงานในกรุงเวียนนาและเบอร์ลิน
  • ...

เราได้เรียนรู้ไม่รู้ไม่ได้ที่จะขอเครื่องมือค้นหาคำถามดังกล่าว

ในหลักการทั้งหมดที่จำเป็นต้องใช้ความรู้เป็นบนเว็บ - มากที่สุดของมันแม้จะอยู่ในรูปแบบที่เครื่องอ่าน แต่ไม่มีการรวมข้อมูลโดยอัตโนมัติในการประมวลผล (และเหตุผล) เราไม่สามารถได้คำตอบที่มีประโยชน์



    มีปัญหากับเว็บคืออะไร

    • ไม่สามารถที่จะบูรณาการและหลอมรวมข้อมูลจากแหล่งข้อมูลที่แตกต่างกัน
    • มีการขาดความรู้พื้นฐานที่ครอบคลุมในการตีความข้อมูลที่พบบนเว็บเป็น
    • ค้นหาเว็บปัจจุบันถูก จำกัด ให้ข้อความในภาษาบางอย่าง - มีหลายภาษา "เล็ก" มีข้อมูลมากน้อยกว่าที่มีอยู่ในภาษาอังกฤษ


    ส่วนผสมพื้นฐานสำหรับเว็บแบบ Semantic

    • มาตรฐานเปิดสำหรับข้อมูลที่อธิบายบนเว็บ
    • วิธีการในการได้รับข้อมูลเพิ่มเติมจากรายละเอียดต่างๆ

    เราจะพูดคุยเกี่ยวกับเรื่องเหล่านี้ในวิชานี้


    รุ่นการเข้าถึงข้อมูลและการบูรณาการ

    การบูรณาการข้อมูล

    รวมข้อมูลองค์กร

    ชุดของแหล่งข้อมูลต่างกันปรากฏเป็นโสดแหล่งข้อมูลเหมือนกัน

    คลังข้อมูล
    • บนพื้นฐานของสารสกัดจากแปลงโหลด (ETL)
    • Global-As-View (GAV)

    การวิจัย

    • ไกล่เกลี่ย
    • อภิปรัชญาตาม
    • P2P
    • บริการ Web-Based

    เว็บข้อมูล

    • ยูริเป็นตัวระบุนิติบุคคล
    • HTTP เป็นโปรโตคอลการเข้าถึงข้อมูล
    • ท้องถิ่นในฐานะที่เป็นดู (ระงับ)
    การเข้าถึงข้อมูล

    แมปวัตถุสัมพันธ์ (ออม)

    • ถัดไป EOF / WebObjects
    • นิติบุคคล Framework ADO.NET
    • จำศีล

    APIs ขั้นตอน

    • ODBC
    • JDBC

    ภาษาสอบถาม

    • Datalog, SQL
    • XPath / XQuery
    • SPARQL

    ข้อมูลที่เชื่อมโยง

    • de-referenceable ยูริ
    • อนุกรม RDF
    แบบจำลองข้อมูล

    RDBMS

    • จัดระเบียบข้อมูลในความสัมพันธ์ระหว่างแถวเซลล์
    • ของ Oracle, DB2, MS-SQL


    LOD มีเมฆพฤษภาคม 2007



    LOD 2007 มีเมฆตุลาคม



    LOD 2008 มีเมฆกุมภาพันธ์



    LOD 2008 มีเมฆกันยายน



    LOD มีเมฆมีนาคม 2009



    LOD มีเมฆกันยายน 2010



    เว็บของข้อมูล

    • > 50000000000 ข้อเท็จจริง
    • ครอบคลุมโดเมนที่แตกต่างกันหลายคน (วิทยาศาสตร์เพื่อชีวิต, ทางภูมิศาสตร์ที่ผู้ใช้สร้างเนื้อหารัฐบาล bibiographic, ... )

    Sources
    lod-cloud.net (originally from slide slide เว็บของข้อมูล )

    แผนที่ไปยังเว็บแบบ Semantic



    ความหมายของกองเว็บข้อมูล

    ส่วนติดต่อผู้ใช้และการประยุกต์ใช้ เชื่อถือ การเข้ารหัสลับ พิสูจน์ ลอจิก Unifying กฎ: RIF อภิปรัชญา: นกฮูก แบบสอบถาม: SPARQL RDF-Schema การแลกเปลี่ยนข้อมูล: RDF XML URI Unicode


    ยูริและ Unicode



    ทรัพยากรรายละเอียดกรอบ - RDF

    ข้อมูลจะถูกแสดงใน RDF อเนกประสงค์ (เรียกว่างบข้อเท็จจริง):

    • จำลองในหมวดหมู่ของหนังสือ แต่ไม่สอดคล้องกันเสมอ
    • ที่ได้รับมอบหมายอนุญาตให้ใช้:
      • เรื่อง: URI โหนดหรือเปล่า
      • สรุป: URI (ทรัพย์สิน a​​ka)
      • วัตถุ: URI โหนดว่างเปล่าหรือตัวอักษร
    • ป้ายโหนดและขอบควรจะโปร่งใสเพื่อให้กราฟเดิม reconstructable จากรายการสาม


    RDF Schema

    อเนกประสงค์ทั้งหมดไม่ได้ทำให้ความรู้สึก:

    Cinema  AlbertEinstein  2012

    วิธีที่เราสามารถ จำกัด การใช้ RDF?

    RDF Schema ช่วยให้การกำหนดคุณสมบัติชั้นเรียนและ จำกัด การใช้งานของพวกเขา



    SPARQL - ภาษาของแบบสอบถามสำหรับ RDF


    SELECT * WHERE { jwebsp:John  foaf:knows  ?friend }


    อภิปรัชญาเว็บภาษา - นกฮูก



    วรรณคดี

    • ปาสคาล hitzler มาร์คัสKrötzschเซบาสเตียนรูดอล์ฟ: ฐานรากของเทคโนโลยีเว็บเชิงความหมายแชปแมนฮอลล์และ / CRC, 2009, 455 หน้าปกเลข ISBN: 9781420090505, http://www.semantic-web-book.org
    • Amit Sheth, Krishnaprasad Thirunarayan: อรรถอำนาจ Web 3.0: การจัดการองค์กร, สังคม, Sensor, ข้อมูลและเมฆที่ใช้และบริการสำหรับการใช้งานขั้นสูง (บรรยายการสังเคราะห์ในการจัดการข้อมูล), มอร์แกน & Claypool Publishers (19 ธันวาคม 2012), ไอ: 1608457168
    • ทอม Heath, คริสเตียน Bizer: ข้อมูลที่เชื่อมโยง (บรรยายการสังเคราะห์บนเว็บแบบ Semantic: ทฤษฎีและเทคโนโลยี), มอร์แกน & Claypool Publishers; ฉบับที่ 1 (20 ก. พ. 2011), ไอ: 1608454304

    Sources
    http://flic.kr/p/4a1YRQ (originally from slide slide วรรณคดี )



    Creator: soeren (TIB)

    Contributors:
    -


    Licensed under the Creative Commons
    Attribution ShareAlike CC-BY-SA license


    This deck was created using SlideWiki.