9 Pages: 123456789



IBM 1620 เครื่องประมวลผลข้อมูล, 1962





เว็บ

เว็บมาพร้อมกับการเปลี่ยนแปลงจากอุตสาหกรรมต่อสังคมข้อมูลและให้โครงสร้างพื้นฐานที่มีคุณภาพใหม่ของการจัดการข้อมูลเกี่ยวกับการซื้อกิจการเช่นเดียวกับการจัดเตรียม

  • พร้อมใช้งานสูง
  • ความเกี่ยวข้องสูง
  • ค่าใช้จ่ายต่ำ



เว็บแทรกเข้ามาในสังคม

  • การติดต่อทางสังคม (แพลตฟอร์มเครือข่ายทางสังคม, บล็อก, ... )
  • เศรษฐศาสตร์ (ซื้อ, การโฆษณา, การขาย, ... )
  • การบริหาร (eGovernment)
  • ชีวิตการทำงาน (รวบรวมข้อมูลและการแบ่งปัน)
  • สันทนาการ (เกมเล่นบทบาท, ความคิดสร้างสรรค์, ... )
  • การศึกษา (eLearning, เว็บเป็นระบบข้อมูล, ... )


เว็บปัจจุบัน

ที่ประสบความสำเร็จอย่างกว้างขวาง
  • จำนวนมากของข้อมูลและข้อมูล
  • มาตรฐานไวยากรณ์สำหรับการถ่ายโอนข้อมูลที่มีโครงสร้าง
  • เครื่อง processable เอกสารที่มนุษย์สามารถอ่านได้
แต่:
  • เนื้อหา / ความรู้ที่ไม่สามารถเข้าถึงได้โดยเครื่อง
  • ความหมาย (ความหมาย) ของข้อมูลที่ถ่ายโอนไม่สามารถเข้าถึงได้


ข้อ จำกัด ของเว็บ

ข้อมูลที่มากเกินไปกับโครงสร้างน้อยเกินไปและทำให้การบริโภคของมนุษย์
  • การค้นหาเนื้อหาเป็นง่ายมาก
  • อนาคต→ต้องใช้วิธีการที่ดีกว่า
เนื้อหาของเว็บที่ต่างกันคือ
  • ในแง่ของเนื้อหา
  • ในแง่ของโครงสร้าง
  • ในแง่ของการเข้ารหัสอักขระ
  • อนาคต→ต้องบูรณาการข้อมูลที่ชาญฉลาด
มนุษย์สามารถได้รับข้อมูลใหม่ (โดยปริยาย) จากชิ้นส่วนที่กำหนดของข้อมูลบนเว็บ แต่ปัจจุบันเราสามารถจัดการกับไวยากรณ์
  • →ต้องใช้เทคนิคเหตุผลอัตโนมัติ


สิ่งที่ Google ไม่พบ

มีข้อมูลจำนวนมากต้องการเครื่องมือค้นหาในปัจจุบันไม่สามารถตอบสนองคือ:
  • อพาร์ทเมนให้เช่าใกล้กับร้านอาหารที่ดีจัดอันดับไทย
  • สองภาษาการดูแลเด็กภาษาอังกฤษเยอรมันในกรุงเบอร์ลินในสามารถเข้าถึงได้ 15 นาทีจากสถานที่ของฉันของการทำงาน
  • เด็กที่เป็นมิตรสถานที่ท่องเที่ยวกับกิจกรรมวัฒนธรรมและการกีฬา
  • นักวิจัยที่ทำงานอยู่ในเอเชียตะวันออกเฉียงใต้ในหัวข้อการดึงข้อมูล
  • ผู้ให้บริการ ERP ที่มีสำนักงานในกรุงเวียนนาและเบอร์ลิน
  • ...

เราได้เรียนรู้ไม่รู้ไม่ได้ที่จะขอเครื่องมือค้นหาคำถามดังกล่าว

ในหลักการทั้งหมดที่จำเป็นต้องใช้ความรู้เป็นบนเว็บ - มากที่สุดของมันแม้จะอยู่ในรูปแบบที่เครื่องอ่าน แต่ไม่มีการรวมข้อมูลโดยอัตโนมัติในการประมวลผล (และเหตุผล) เราไม่สามารถได้คำตอบที่มีประโยชน์



    มีปัญหากับเว็บคืออะไร

    • ไม่สามารถที่จะบูรณาการและหลอมรวมข้อมูลจากแหล่งข้อมูลที่แตกต่างกัน
    • มีการขาดความรู้พื้นฐานที่ครอบคลุมในการตีความข้อมูลที่พบบนเว็บเป็น
    • ค้นหาเว็บปัจจุบันถูก จำกัด ให้ข้อความในภาษาบางอย่าง - มีหลายภาษา "เล็ก" มีข้อมูลมากน้อยกว่าที่มีอยู่ในภาษาอังกฤษ


    ส่วนผสมพื้นฐานสำหรับเว็บแบบ Semantic

    • มาตรฐานเปิดสำหรับข้อมูลที่อธิบายบนเว็บ
    • วิธีการในการได้รับข้อมูลเพิ่มเติมจากรายละเอียดต่างๆ

    เราจะพูดคุยเกี่ยวกับเรื่องเหล่านี้ในวิชานี้


    รุ่นการเข้าถึงข้อมูลและการบูรณาการ

    การบูรณาการข้อมูล

    รวมข้อมูลองค์กร

    ชุดของแหล่งข้อมูลต่างกันปรากฏเป็นโสดแหล่งข้อมูลเหมือนกัน

    คลังข้อมูล
    • บนพื้นฐานของสารสกัดจากแปลงโหลด (ETL)
    • Global-As-View (GAV)

    การวิจัย

    • ไกล่เกลี่ย
    • อภิปรัชญาตาม
    • P2P
    • บริการ Web-Based

    เว็บข้อมูล

    • ยูริเป็นตัวระบุนิติบุคคล
    • HTTP เป็นโปรโตคอลการเข้าถึงข้อมูล
    • ท้องถิ่นในฐานะที่เป็นดู (ระงับ)
    การเข้าถึงข้อมูล

    แมปวัตถุสัมพันธ์ (ออม)

    • ถัดไป EOF / WebObjects
    • นิติบุคคล Framework ADO.NET
    • จำศีล

    APIs ขั้นตอน

    • ODBC
    • JDBC

    ภาษาสอบถาม

    • Datalog, SQL
    • XPath / XQuery
    • SPARQL

    ข้อมูลที่เชื่อมโยง

    • de-referenceable ยูริ
    • อนุกรม RDF
    แบบจำลองข้อมูล

    RDBMS

    • จัดระเบียบข้อมูลในความสัมพันธ์ระหว่างแถวเซลล์
    • ของ Oracle, DB2, MS-SQL


    LOD มีเมฆพฤษภาคม 2007



    LOD 2007 มีเมฆตุลาคม



    LOD 2008 มีเมฆกุมภาพันธ์



    LOD 2008 มีเมฆกันยายน



    LOD มีเมฆมีนาคม 2009



    LOD มีเมฆกันยายน 2010



    เว็บของข้อมูล

    • > 50000000000 ข้อเท็จจริง
    • ครอบคลุมโดเมนที่แตกต่างกันหลายคน (วิทยาศาสตร์เพื่อชีวิต, ทางภูมิศาสตร์ที่ผู้ใช้สร้างเนื้อหารัฐบาล bibiographic, ... )


    แผนที่ไปยังเว็บแบบ Semantic



    ความหมายของกองเว็บข้อมูล

    ส่วนติดต่อผู้ใช้และการประยุกต์ใช้ เชื่อถือ การเข้ารหัสลับ พิสูจน์ ลอจิก Unifying กฎ: RIF อภิปรัชญา: นกฮูก แบบสอบถาม: SPARQL RDF-Schema การแลกเปลี่ยนข้อมูล: RDF XML URI Unicode


    ยูริและ Unicode



    ทรัพยากรรายละเอียดกรอบ - RDF

    ข้อมูลจะถูกแสดงใน RDF อเนกประสงค์ (เรียกว่างบข้อเท็จจริง):

    • จำลองในหมวดหมู่ของหนังสือ แต่ไม่สอดคล้องกันเสมอ
    • ที่ได้รับมอบหมายอนุญาตให้ใช้:
      • เรื่อง: URI โหนดหรือเปล่า
      • สรุป: URI (ทรัพย์สิน a​​ka)
      • วัตถุ: URI โหนดว่างเปล่าหรือตัวอักษร
    • ป้ายโหนดและขอบควรจะโปร่งใสเพื่อให้กราฟเดิม reconstructable จากรายการสาม


    RDF Schema

    อเนกประสงค์ทั้งหมดไม่ได้ทำให้ความรู้สึก:

    Cinema  AlbertEinstein  2012

    วิธีที่เราสามารถ จำกัด การใช้ RDF?

    RDF Schema ช่วยให้การกำหนดคุณสมบัติชั้นเรียนและ จำกัด การใช้งานของพวกเขา



    SPARQL - ภาษาของแบบสอบถามสำหรับ RDF


    SELECT * WHERE { jwebsp:John  foaf:knows  ?friend }


    อภิปรัชญาเว็บภาษา - นกฮูก



    วรรณคดี

    • ปาสคาล hitzler มาร์คัสKrötzschเซบาสเตียนรูดอล์ฟ: ฐานรากของเทคโนโลยีเว็บเชิงความหมายแชปแมนฮอลล์และ / CRC, 2009, 455 หน้าปกเลข ISBN: 9781420090505, http://www.semantic-web-book.org
    • Amit Sheth, Krishnaprasad Thirunarayan: อรรถอำนาจ Web 3.0: การจัดการองค์กร, สังคม, Sensor, ข้อมูลและเมฆที่ใช้และบริการสำหรับการใช้งานขั้นสูง (บรรยายการสังเคราะห์ในการจัดการข้อมูล), มอร์แกน & Claypool Publishers (19 ธันวาคม 2012), ไอ: 1608457168
    • ทอม Heath, คริสเตียน Bizer: ข้อมูลที่เชื่อมโยง (บรรยายการสังเคราะห์บนเว็บแบบ Semantic: ทฤษฎีและเทคโนโลยี), มอร์แกน & Claypool Publishers; ฉบับที่ 1 (20 ก. พ. 2011), ไอ: 1608454304


     


    แรงจูงใจ

    คุณเข้ารหัสชิ้นส่วนของความรู้วิธีการ:

    "ทฤษฎีสัมพัทธภาพถูกค้นพบโดยอัลเบิร์ Einstein."

    หรือ

    หรือ


    ข้อมูลแสดงในรูปแบบดังกล่าวไม่ได้เป็นปริได้อย่างง่ายดาย! RDF จะช่วยให้การแก้ปัญหานี้!



    เป้าหมาย

    • ทำความเข้าใจกับรูปแบบ RDF ข้อมูลรวมทั้ง
      • แนวคิด URI และ IRI
      • อเนกประสงค์
      • ทรัพยากร
      • ตัวอักษร
      • โหนดที่ว่างเปล่า
      • รายการ


    เบื้องต้น

    • ความเข้าใจพื้นฐานของเทคโนโลยีเว็บชนิดข้อมูล


    ภาพรวมที่ RDF

    • RDF = ทรัพยากรอธิบายหลักการ
    • คำแนะนำของ W3C ตั้งแต่ปี 1998
    • RDF เป็นรูปแบบข้อมูล
      • แต่เดิมใช้สำหรับ metadata สำหรับทรัพยากรเว็บทั่วไปแล้ว
      • เข้ารหัสข้อมูลที่มีโครงสร้าง
      • ยูนิเวอร์แซรูปแบบการแลกเปลี่ยนเครื่องอ่านได้
    • ข้อมูลโครงสร้างในกราฟ
      • จุดขอบ


    บางส่วนของกราฟ RDF

    • ยูริ
      • ที่ใช้ในการอ้างอิงทรัพยากรอย่างไม่น่าสงสัย
    • ตัวอักษร
      • อธิบายค่าของข้อมูลที่มีตัวตนชัดเจนเช่น "100 กม. / ชม. "
    • โหนดที่ว่างเปล่า
      • อำนวยความสะดวกในปริมาณอัตถิภาวนิยมสำหรับบุคคลที่มีคุณสมบัติบางอย่างโดยไม่ต้องตั้งชื่อ


    ตัวอย่างของกราฟ RDF



    ทริปเปิ RDF

    องค์ประกอบของ RDF สาม:

    • ถ่ายแบบใช้ประเภทภาษาศาสตร์ ( แต่ไม่สอดคล้องกันเสมอไป)
    • ที่ได้รับมอบหมายอนุญาตให้ใช้:
      • เรื่อง: URI โหนดหรือเปล่า
      • สรุป: URI (ทรัพย์สิน a​​ka)
      • วัตถุ: URI โหนดว่างเปล่าหรือตัวอักษร
    • ป้ายโหนดและขอบควรจะโปร่งใสเพื่อให้กราฟเดิม reconstructable จากรายการสาม


    URI

    • URI = ทรัพยากรตัวบ่งชี้
    • ที่ใช้ในการสร้างชื่อซ้ำกันทั่วโลกสำหรับทรัพยากร
    • วัตถุที่มีตัวตนชัดเจนทุกคนสามารถเป็นทรัพยากร
      • หนังสือ, สถานที่, องค์กร ...
    • ในโดเมนหนังสือไอทำหน้าที่จุดประสงค์เดียวกัน


    ไวยากรณ์ URI

    • ส่วนต่อขยายของแนวคิด URL
    • ไม่ได้หมายถึงทุก URI เอกสารเว็บ แต่ URL ที่มักจะใช้เป็น URI สำหรับเอกสารเว็บ
    • เริ่มต้นด้วยสคี URL ซึ่งจะถูกแยกออกจากส่วนที่เหลือด้วย ":"
      • ตัวอย่าง: http:, FTP, mailto, ไฟล์
    • โครงสร้างลำดับชั้นโดยทั่วไปแล้ว
      • [โครงการ:] [/ / อำนาจ] [path] [? แบบสอบถาม] [ส่วน #]


    ที่กำหนดเองยูริ

    • จำเป็นถ้าทรัพยากรที่มี URI ยังไม่มี URI หรือไม่เป็นที่รู้จัก
    • ใช้ HTTP-URIs จากเว็บไซต์ของตัวเองเพื่อหลีกเลี่ยงการชนกันของการตั้งชื่อ
    • อำนวยความสะดวกในการสร้างเอกสารของ URI สถานที่นี้
    • ตัวอย่าง: http://jens-lehmann.org/foaf.rdf # ผม


    • แยก URI สำหรับทรัพยากรและเอกสารประกอบด้วยความช่วยเหลือของการอ้างอิง URI (ด้วย "#" เศษเล็กเศษน้อยที่แนบมา) หรือการเจรจาต่อรองเนื้อหา
    • ตัวอย่าง: URI สำหรับเช็คสเปียร์ "Othello"
      • ไม่ดี: http://de.wikipedia.org/wiki/Othello
      • ดี http://de.wikipedia.org/wiki/Othello # URI


    ม่านตา

    • IRI ทรัพยากรตัวบ่งชี้ = สากล
    • ลักษณะทั่วไปของแนวคิด URI
    • IRI สามารถมี Unicode
    • ตัวอย่าง:
      • http://www.example.org/Wüste
      • http://www.example.org/ 사막




    ตัวอักษร

    • ที่ใช้ในการค่าข้อมูลแบบ
    • แทนเป็นสตริง
    • การตีความประเภทข้อมูลผ่าน
    • ตัวอักษรโดยไม่ต้องได้รับการรักษาประเภทข้อมูลเป็นสตริง
    • ตัวอักษรอาจจะไม่เคยมาของโหนดของกราฟ RDF
    • ขอบอาจไม่ถูกกำกับด้วยตัวอักษร


    ไวยากรณ์เต่า

    • ภาษาเพื่อทำให้เป็นอันดับอเนกประสงค์ RDF สตริง
    • เต่า - รวบรัดภาษา RDF Triple
    • ยูริในวงเล็บมุม
      • <http://dbpedia.org/resource/Leipzig>
    • ตัวอักษรในเครื่องหมายคำพูด
      • "ไลพ์ซิก" @ เดอ
      • "51.333332" ^ ^ XSD: ลอย
    • สามแยกด้วยจุด
      <http://dbpedia.org/resource/Leipzig> <http://www.w3.org/2000/01/rdf-schema#label> "Leipzig"@de .
      
    • ช่องว่างสีขาวและแบ่งบรรทัดจะถูกละเลยด้านนอกของตัวระบุ
    • สถานะ: W3C ทำงานร่างกรกฎาคม 10, 2012, http://www.w3.org/TR/turtle/


    ย่อเต่า (1/2)

    • ในเต่าหนึ่งสามารถใช้ตัวย่อ
      • ไวยากรณ์: @ คำนำหน้า abbr ':' <URI>
      • เช่น @ คำนำหน้า DBR: <http://dbpedia.org/resource/>
    • หนึ่งสามารถเปลี่ยน
      <http://dbpedia.org/resource/Leipzig> <http://www.w3.org/2000/01/rdf-schema#label> "Leipzig"@de . 
      
    • เข้าไป
    @prefix dbr: <http://dbpedia.org/resource/> . @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema> . dbr:Leipzig rdfs:label "Leipzig"@de .


    ย่อเต่า (2/2)

    • อเนกประสงค์กับเรื่องเดียวกันสามารถรวมกลุ่มกัน
      @prefix rdf: 
      ...
      @prefix geo: 
      
      dbr:Leipzig dbp:hasMayor dbr:Burkhard_Jung ;
                  rdfs:label   "Leipzig"@de ;
                  geo:lat      "51.333332"^^xsd:float ;
                  geo:long     "12.383333"^^xsd:float .   
    • อเนกประสงค์ถึงแม้จะมีเรื่องเดียวกันและคำกริยาสามารถรวมกลุ่มกัน
      @prefix dbr:  .
      @prefix dbp:  .
      dbr:Leipzig dbp:locatedIn dbr:Saxony, dbr:Germany;
                  dbp:hasMayor  dbr:Burkhard_Jung .
      


    ตัวอักษร II - ประเภทข้อมูล

    • ตัวอย่าง: XSD: ทศนิยม


    ประเภทข้อมูลใน RDF

    • จนถึงขณะนี้: ตัวอักษรจะ untyped รับการรักษาเป็นสตริง: "02" <"100" <"11" <"2"
    • พิมพ์ดีดช่วยให้ดีขึ้นในคำอื่น ๆ , การตีความความหมายของค่า
    • ประเภทข้อมูลได้รับการระบุโดยยูริและ chosable ได้อย่างอิสระ
    • การใช้งานโดยปกติของ XML--สคีประเภทข้อมูล (XSD)
    • ไวยากรณ์: "ค่าข้อมูล" ^ ^ datetype-URI
    • RDF: XMLLiteral เป็นเพียงประเภทข้อมูลที่กำหนดไว้ล่วงหน้าใน RDF
      • ใช้สำหรับชิ้นส่วน XML


    ตัวอย่าง

    กราฟ:



    เต่า:


    @prefix dbr: <http://dbpedia.org/resource/> . @prefix geo: <http://www.w3.org/2003/01/geo/wgs84_pos#>. @prefix xsd: <http://www.w3.org/2001/XMLSchema#> . dbr:Leipzig    geo:lat "51.333332"^^xsd:float , geo:long "12.383333"^^xsd:float .


    ประกาศภาษา

    • ที่มีอิทธิพลต่อตัวอักษร untyped เพียง
    • ตัวอย่าง:
    • ตามข้อกำหนด RDF ตัวอักษรต่อไปนี้จะแตกต่างกัน
    • แต่มักจะถูกนำมาใช้เป็นอย่างเท่าเทียมกัน



    n-Ary ผมความสัมพันธ์

    การปรุงอาหารด้วย RDF

    "สำหรับการเตรียมการของมะม่วง Chutney คุณต้อง 450g มะม่วงสีเขียว , ช้อนชาพริกป่น ... "

    1 ความพยายามที่จะสร้างแบบจำลองสูตรนี้:

    @prefix ex: <http://example.org/> . ex:Chutney ex:hatZutat "450g grüne Mango", "1TL Cayennepfeffer" .  


    ไม่พอใจ:

    • ส่วนผสมและจำนวนเงินที่กำหนดเป็นสตริง
    • ค้นหาสูตรอาหารที่มีมะม่วงสีเขียวไม่ได้เป็นไปได้อย่างง่ายดาย




    n-Ary II ความสัมพันธ์

    การปรุงอาหารด้วย RDF

    "สำหรับการเตรียมการของมะม่วง Chutney คุณต้อง 450g มะม่วงสีเขียว, ช้อนชาพริกป่น ... "

    ความพยายามที่ 2 แบบสูตรนี้:

    @prefix ex: http://example.org/ . ex:Chutney ex:Zutat ex:grüneMango; ex:Menge "450g" ; ex:Zutat ex:Cayennepfeffer; ex:Menge "1TL" .


    แม้เลว:

    • ไม่มีความสัมพันธ์ที่ชัดเจนระหว่างส่วนผสมและจำนวนเงินที่เป็นไปได้




    n-Ary III ความสัมพันธ์

    ปัญหา: มันเป็นความสัมพันธ์ trivalent หรือ ternary จริง (ดูฐานข้อมูลเช่น)

    ตำรับ ส่วนผสม จำนวน
    มะม่วง Chutney
    มะม่วงสีเขียว
    450g
    มะม่วง Chutney พริกป่น
    1 TS
    • โดยตรงไปไม่ได้ที่จะแสดงใน RDF
    • การแก้ปัญหาเบื้องต้นของโหนดผู้ช่วย


    n-Ary IV ความสัมพันธ์

    โหนดช่วยใน RDF:

    เป็นกราฟ:


    ในไวยากรณ์เต่า:

    @prefix ex: <http://example.org/> . @prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> . ex:Chutney ex:hasIngredient ex:ChutneyIngredient1. ex:ChutneyIngredient1 ex:ingredient ex:GreenMango; ex:amount "450g" .


    โหนดที่ว่างเปล่า

    • โหนดที่ว่างเปล่าที่สามารถใช้สำหรับทรัพยากรที่ไม่จำเป็นต้องมีการตั้งชื่อ
    • สามารถอ่านได้ว่างบอัตถิภาวนิยม

    เป็นกราฟ:


    ไวยากรณ์เต่า:

    @prefix ex: <http://example.org/> . ex:Chutney ex:hasIngredient; _:id1 . _:id1 ex:Ingredient ex:GreenMango; ex:amount "450g" . // can be shortened @prefix ex: <http://example.org/> . ex:Chutney ex:hasIngredient [ ex:ingredient ex:GreenMango; ex:amount "450g" ] .


    รายการ

    • โครงสร้างข้อมูลทั่วไปนับจากทรัพยากรจำนวนมากโดยพลการเขียนด้วยเช่นการสั่งซื้อที่ไม่เกี่ยวข้องของหนังสือเล่มนี้
    • ความแตกต่างระหว่าง
      • คอนเทนเนอร์เพิ่มองค์ประกอบใหม่ที่เป็นไปได้
      • คอลเลกชัน: การเพิ่มองค์ประกอบใหม่เป็นไปไม่ได้
    • สามารถจำลองด้วยเครื่องมือที่นำเสนอก่อนหน้านี้จึงไม่ลึกซึ้งเพิ่มเติม


    ประเภทของภาชนะบรรจุ

    • โหนดรากรายการมีการกำหนดอย่างใดอย่างหนึ่งดังต่อไปนี้ RDF: s ประเภท:
      • RDF: Seq
        • การตีความเป็นลำดับสั่งรายการ
      • RDF: กระเป๋า
        • การตีความตามสั่งตั้ง
        • สั่งซื้อรหัสใน RDF ไม่เกี่ยวข้อง
      • RDF: Alt
        • ชุดของทางเลือก
        • มักจะมีเพียงองค์ประกอบหนึ่งรายการที่เกี่ยวข้อง


    ภาชนะ



    คอลเลกชัน

    ความคิด: พาร์ทิชันซ้ำของรายการในองค์ประกอบหัวและรายการส่วนที่เหลือ (ที่ว่างเปล่าอาจจะ)


    ไวยากรณ์เต่า (สัญลักษณ์สั้นลงด้วยวงเล็บ)

    @prefix ex: <http://example.org/> . ex:AKSW ex:groupLeaders (ex:Sören ex:Jens ex:Axel) .


    ข้อมูลอย่างย่อ

    • มาตรฐานการสนับสนุนอย่างกว้างขวางสำหรับการจัดเก็บและการแลกเปลี่ยนข้อมูล
    • ช่วยให้เกือบตัวแทนไวยากรณ์เป็นอิสระจากข้อมูลการกระจายในรูปแบบของกราฟรูปแบบข้อมูลตาม
    • บริสุทธิ์ RDF เป็นบุคคลที่มุ่งเน้นมาก
    • เกือบจะเป็นไปได้ที่จะเป็นตัวแทนของคีไม่
      • ดูบรรยาย RDF-Schema


    อนาคต

    • ต้นมาก ร่างการทำงาน
    • รุ่นก่อนหน้านี้ของ RDF ใช้คำว่า "อ้างอิง RDF URI" แทน "IRI" และอนุญาตให้ตัวละครเพิ่มอีก: " < "," > "," { "," } "," | "," \ "," ^ " " ` "' '(คู่ quote) และ " "(เว้นวรรค)
    • ใน Iris อักขระเหล่านี้จะต้องมีเปอร์เซ็นต์การเข้ารหัสตามที่อธิบายไว้ใน 2.1 ส่วน ของ [ RFC3986 ]
    • ตัวอักษรที่มีแท็กภาษาตอนนี้ยังมีประเภทข้อมูล IRI


    งานและโครงการมินิ

    สไลด์นี้มีคำแนะนำบางส่วนสำหรับงานและโครงการขนาดเล็กที่คุณสามารถดำเนินการนอกเหนือไปจากหลายทางเลือกการทดสอบการประเมินตนเองเพื่อการปฏิบัติและการเตรียมความพร้อมสำหรับการสอบ:

    • อธิบายองค์ประกอบของรูปแบบ RDF ข้อมูล
    • สร้างฐานความรู้เล็ก ๆ ในเต่า (เช่นครอบครัวของคุณ) อธิบายโดเมนที่คุณเลือก!
    • เขียนคำอธิบายของทรัพยากร RDF อธิบายตัวเองอยู่ในเต่าที่มีป้ายชื่อในสองภาษาที่แตกต่างกัน, วันเกิดและอายุของคุณ!
    • วาดกราฟ RDF แทนสูตรสำหรับเค้กถ้วย!
    • สร้างรายการ RDF มณฑลอเมริกาเหนือ!


     


    ความหมายของกองเว็บข้อมูล - RDF

    การแลกเปลี่ยนข้อมูล: RDF URI ส่วนติดต่อผู้ใช้และการประยุกต์ใช้ เชื่อถือ การเข้ารหัสลับ พิสูจน์ ลอจิก Unifying อภิปรัชญา: นกฮูก กฎ: RIF แบบสอบถาม: SPARQL RDF-Schema XML Unicode


    เป้าหมาย

    • Repitition ของยูริสและคุณสมบัติของพวกเขา
    • ไวยากรณ์ของ RDF
    • รูปแบบที่แตกต่างกันของรูปแบบอนุกรม
      • 3 สัญกรณ์
      • RDF / XML
      • RDF / JSON, JSON / LD
      • RDFa
      • NTriples เต่า


    เงื่อนไข

    • ความรู้พื้นฐานของสแต็ค RDF
    • ทำความเข้าใจกับรูปแบบ RDF ข้อมูล
    • ความเข้าใจพื้นฐานของ XML (สำหรับอนุกรม RDF / XML)
    • ความเข้าใจพื้นฐานของ HTM​​L (สำหรับ RDFa)
    • ทั้งหมดที่ใช้คำนำหน้า namespace แก้ไขเป็นค่าเริ่มต้นตามลำดับจาก http://prefix.cc/


    สิ่งที่ยูริสคืออะไร?

    • URI = ทรัพยากรตัวบ่งชี้
    • ทั่วโลกที่ใช้สำหรับการระบุที่ไม่ซ้ำกันของทรัพยากร
    • ทุกวัตถ​​ุ (ในบริบทของการประยุกต์ใช้) บางทีทรัพยากร
      • ตราบเท่าที่มันมีเอกลักษณ์เฉพาะ
      • เช่นหนังสือ, สถานที่, คน, ความสัมพันธ์ระหว่างสิ่งเหล่านั้นแนวคิดที่เป็นนามธรรม
    • รูปพรรณที่ไม่ซ้ำกันถูกนำมาใช้แล้วสำหรับโดเมนอื่น ๆ และเฉพาะเจาะจงมากขึ้นเช่น ISBN สำหรับหนังสือหรือตัวเลขประจำตัวผู้เสียภาษีสำหรับคนที่
    • ส่วนต่อขยายของแนวคิด URL:
      • ไม่ได้ทุก URI เป็นของหน้าเว็บ แต่มักจะพิมพ์ URL ถูกใช้เป็น URI สำหรับหน้าเว็บ




    ไวยากรณ์ของยูริ

    • ทิม Berners-Lee ส่ง 1994 RFC 1,630 เกี่ยวกับยูริ
      • เริ่มต้นด้วยคี URI
      • โปรโตคอลแยกต่างหากและลำดับชั้นโดย ':' เช่น HTTP, FTP หรือ mailto
        • พารามิเตอร์แบบสอบถามสามารถถูกผนวกโดยใช้ชั้นนำ '?'
        • ระบุ Fragment สามารถถูกผนวกโดยใช้ชั้นนำ '#'

        โปรโตคอล ":" "?" ลำดับชั้น [ แบบสอบถาม] [ส่วน "#"]
    http://en.wikipedia.org/w/index.php?search=rdf http://en.wikipedia.org/wiki/Resource_Description_Framework#Examples


    ที่กำหนดเองยูริ

    • จำเป็นถ้าทรัพยากรที่มี URI ยังไม่มี
    • กลยุทธ์ที่เป็นไปได้เพื่อหลีกเลี่ยงการทับซ้อนกันยูริ
      • ใช้ HTTP-URIs ของ webspace ของตัวเอง!
      • นอกจากนี้ยังเป็นไปได้ที่จะเผยแพร่เอกสารของ URI ที่สถานที่แห่งนี้
      • เช่น http://jens-lehmann.org/foaf.rdf # ผม


    ระบบบัตรประจำตัวอื่น ๆ

    • IRI ทรัพยากรตัวบ่งชี้ = สากล
      • ลักษณะทั่วไปของ URI, สามารถมีตัวอักษร Un​​icode
      • http://www.example.org/Wüsteเช่น
    • โกศทรัพยากรชื่อ = Uniform
      • กลุ่มย่อยของยูริที่ใช้สำหรับการระบุทรัพยากรที่มีชื่อ choosable ได้อย่างอิสระ
      • มีไว้สำหรับการระบุเอกลักษณ์และถาวรทั่วโลก
      • โกศเช่นโกศ ISSN :0167-6423 จากภาพยนตร์แมงมุม
    • ไอ = นานาชาติจำนวนหนังสือมาตรฐาน
      • เช่นไอ 978-3-86680-192-9
    • ISSN = มาตรฐานสากล Serial Number ของ
      • เช่น ISSN 1234-5678
    • DOI = ตัวระบุวัตถุดิจิตอล
      • เช่น 10.1000/182 DOI


    พลังของรูปแบบ RDF



    รูปแบบที่นิยมมากที่สุด

    • รูปแบบอนุกรมต่างๆเพื่อวัตถุประสงค์ที่แตกต่างกัน (เช่นในแผนภาพเวนน์บนภาพนิ่งก่อน) คือ:
      • ยังไม่มีข้อความที่อเนกประสงค์ - รูปแบบข้อความโดยมุ่งเน้นที่การแยกง่าย
      • เต่า - รูปแบบข้อความโดยมุ่งเน้นที่การอ่านของมนุษย์
      • 3 สัญกรณ์ - รูปแบบข้อความที่มีคุณสมบัติขั้นสูงเกิน RDF
      • RDF / XML - อันดับ XML อย่างเป็นทางการของ RDF
      • RDF / JSON - ข้อเสนอสำหรับ serializing RDF ใน JSON
      • JSON-LD - ข้อเสนอสำหรับการแสดงความ RDF ใน JSON อื่น
      • RDFa - กลไกสำหรับการฝัง RDFa ใน (X) HTML


    3 สัญกรณ์

    • ออกแบบมาสำหรับการอ่านของมนุษย์-
    • ภาษาแบบแผน
      • สูตรเพิ่มเติมกฎและตัวแปร
    • พัฒนาโดย Tim Berners-Lee et al, เป็น W3C ส่งทีม http://www.w3.org/TeamSubmission/n3/
    • ชนิดของไฟล์ text/n3, UTF-8  
    สัญกรณ์ XML:
    <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"   
             xmlns:dc="http://purl.org/dc/elements/1.1/">
       <rdf:Description rdf:about="http://en.wikipedia.org/wiki/Tony_Benn">  
          <dc:title>Tony Benn</dc:title>  
          <dc:publisher>Wikipedia</dc:publisher>
       </rdf:Description>
    </rdf:RDF>
    

    3 สัญกรณ์:

    @prefix dc: <http://purl.org/dc/elements/1.1/>. <http://en.wikipedia.org/wiki/Tony_Benn> dc:title "Tony Benn";                                          dc:publisher "Wikipedia".
    


    คุณสมบัติของ N3

    • N3 เป็นภาษาอย่างเป็นทางการที่นอกเหนือไปจาก RDF
    • N3 เป็น superset ของ sparql เต่าและ NTriples
    • N3 มีประสิทธิภาพมากขึ้นกว่าเต่าและ XML / RDF ด้วยความเคารพในการกระทำตาม
    • N3 จะขึ้นอยู่กับบริบทไวยากรณ์ฟรีอนุญาตให้แยกมันได้อย่างง่ายดาย
    • บางแนวคิดที่โดดเด่นคือ:
      • ตัวแปร
      • สูตร
      • ชุดของตัวแปรสากลของ F
      • ชุดของตัวแปรอัตถิภาวนิยมของ F
      • ชุดของงบ F
      • ประเภทข้อมูล: สตริง, จำนวนเต็ม
      • รายการองค์ประกอบของรายการ
      • ความยาวของรายการ
      • การแสดงออก
      • ตั้ง
    • ข้อมูลเพิ่มเติม:
      • http://www.w3.org/2000/10/swap/grammar/n3-report.html
      • http://www.w3.org/DesignIssues/Notation3.html


    ไวยากรณ์ของ N3

    • รูปแบบที่สาม: คำกริยาวัตถุหัวข้อ
    • ทุกอย่างจะต้องมีการระบุ URI
    • ข้อยกเว้น: '#' ระบุบางสิ่งบางอย่างตลอดทั้งเอกสารสิ่งที่เป็น
    • ข้อยกเว้น: วัตถุที่สามารถเป็นตัวอักษร
    <#pat> <#knowsAbout> <http://www.w3.org/2000/10/swap/Primer> .<#pat> <#hasBrother> <#ian> .
    <#ian> <#age> 24 .
    


    ตัวย่อ

    • ระบุที่ว่างเปล่า <> หมายเสมอกับเอกสารที่เขียนไว้ใน
    <> <http://purl.org/dc/elements/1.1/title> "RDF Serializations".
    
    • หนึ่งสามารถใช้คำนำหน้าย่นข้อความ
    @prefix dc:  <http://purl.org/dc/elements/1.1/> .
    <> dc:title  "RDF Serializations".
    
    • หมายเหตุ: เมื่อคุณใช้คำนำหน้าคุณสามารถใช้เครื่องหมายแทนกัญชาระหว่าง dc และชื่อและคุณไม่ได้ใช้วงเล็บ <angle
    • หากคุณมีงบหลายเกี่ยวกับเรื่องเดียวกับที่คุณสามารถใช้ทั้งอัฒภาคเป็นไปได้ที่จะแนะนำภาคใหม่หรือจุลภาคที่จะแนะนำวัตถุใหม่
    <> <#subsections>  <#RDF/XML>, <#JSON>, <#RDFa> ;
       <#madeBy>    "slidewiki.org" ;
       <#creatorOfThisDeck> <www.informatik.uni-leipzig.de/~auer/foaf.rdf> .


    ประเภทกำหนด

    • N3 ช่วยให้คุณสามารถกำหนดระดับชั้นของคุณเอง
    @prefix : <#> .
    @prefix rdf:  <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
    @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
    :Person rdf:type rdfs:Class .
    
    • หมายเหตุ: เรากำหนดคำนำหน้าว่างเปล่า
    • เรายังสามารถย่อ RDF: ประเภทด้วย
    @prefix : <#> .
    @prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
    :Person a rdfs:Class .
    


    ความเท่าเทียมกันของคำศัพท์

    • เมื่อเขียนคำศัพท์ของตัวเองหนึ่งมักจะสังเกตเห็นว่าแนวความคิดของตัวเองเป็นเช่นเดียวกับในคำศัพท์อื่น
    • N3 มีกลไกพิเศษและสั้นเพื่อให้สอดคล้องคำศัพท์เช่น "="
    :Woman = foo:FemaleAdult .
    :Title a rdf:Property; = dc:title .
    
    • ดังนั้นหนึ่งสามารถจัดชั้นเรียนและคุณสมบัติง่ายสวย


    ตัวอย่างของคุณสมบัติ

    ตัวอย่างแรก:
    @prefix log: <http://www.w3.org/2000/10/swap/log#>.
    @keywords.
    @forAll x, y, z. {x parent y. y sister z} log:implies {x aunt z}
    
    ให้ข้อมูลต่อไปนี้:
    Joe parent Alan.
    Alan sister Susie.
    
    เฟ้นสามารถสรุป:
    Joe aunt Susie.
    


    ตัวอย่างต่อเนื่อง

    ตัวอย่างที่สอง:
    @forAll x, y, z.
    {  x wrote y.
     y log:includes {z weather w}.
     x livesIn z
    } log:implies {
     Boston weather y
    }.
    
    ร่วมกับข้อมูล:
    Bob   livesIn  Boston.
    Bob   wrote    { Boston weather sunny }.
    Alice livesIn  Adelaide.
    Alice wrote   { Boston weather cold }.
    
    เฟ้นสามารถสรุป:
    Boston weather sunny.
    


    ข้อดีและข้อเสียของการ N3

    • ข้อดี
      • มากขึ้นขนาดกะทัดรัดและสามารถอ่านได้มากกว่าที่ยึดตาม XML RDF
      • เป็นไปได้ของรูปแบบการกำหนดตัวแปรและแม้กระทั่งสูตร
      • ประสิทธิภาพมากขึ้นกว่าเต่าและ NTriples
    • ข้อเสีย


    ไวยากรณ์เต่า

    • เต่า - รวบรัดภาษา RDF Triple
    • ยูริในวงเล็บมุม
      • <http://dbpedia.org/resource/Berlin>
    • ตัวอักษรในเครื่องหมายคำพูด
      • "เบอร์ลิน" @ เดอ
      • "51.333332" ^ ^ XSD: ลอย
    • สามแยกด้วยจุด
    • <http://dbpedia.org/resource/Leipzig> <http://www.w3.org/2000/01/rdf-schema#label> "Leipzig"@de .
    • ช่องว่างสีขาวและแบ่งบรรทัดจะถูกละเลยด้านนอกของตัวระบุ
    • สถานะ: W3C ทำงานร่างกรกฎาคม 10, 2012, http://www.w3.org/TR/turtle/


    ย่อเต่า (1/2)

    • ในเต่าหนึ่งสามารถใช้ตัวย่อ
      • ไวยากรณ์: @ คำนำหน้า abbr ':' <URI>
      • เช่น @ คำนำหน้า rdfs: DBR: <http://dbpedia.org/resource/>
    • หนึ่งสามารถเปลี่ยน
    • เข้าไป


    ย่อเต่า (2/2)

    • อเนกประสงค์กับเรื่องเดียวกันสามารถรวมกลุ่มกัน
      @prefix rdf: 
      
      ...
      @prefix geo: 
      
      dbr:Berlin  dbpedia:country  dbpedia:Germany ;            rdfs:label       "Berlin"@de ;      
    • อเนกประสงค์ถึงแม้จะมีเรื่องเดียวกันและคำกริยาสามารถรวมกลุ่มกัน
      @prefix dbr: 
      
      .
      @prefix dbp: 
      
      .
      dbr:Leipzig dbp:locatedIn dbr:Saxony, dbr:Germany;
      dbp:hasMayor  dbr:Burkhard_Jung .
      


    ข้อดีและข้อเสียของ Turtle

    • ข้อดี:
      • กระชับจึงมีประสิทธิภาพในการจัดเก็บ
      • ง่ายต่อการอ่านสำหรับมนุษย์
    • ข้อเสีย:
      • การสนับสนุนเครื่องมือ จำกัด เพื่อให้ห่างไกล (เมื่อเทียบกับ RDF / XML)


    ยังไม่มีข้อความที่อเนกประสงค์-

    • ยังไม่มีข้อความที่อเนกประสงค์เป็นเส้นตามรูปแบบข้อความธรรมดา
    • ยังไม่มีข้อความที่อเนกประสงค์เป็นส่วนย่อยของเต่าและ 3 สัญกรณ์
      • ตัวย่อและ groupping ไม่ได้รับอนุญาต
      • จำกัด ชุดอักขระ ASCII
    • เครื่องมือทั้งหมดที่สนับสนุนการป้อนข้อมูลทั้งในรูปแบบที่กล่าวข้างต้นจะสนับสนุนอเนกประสงค์-N
    • อย่าสับสนกับ 3 สัญกรณ์: 3 สัญกรณ์เป็น superset ของเต่าและ N-อเนกประสงค์
    <http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://purl.org/dc/elements/1.1/creator> "Dave Beckett" .
    <http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://purl.org/dc/elements/1.1/creator> "Art Barstow" .
    <http://www.w3.org/2001/sw/RDFCore/ntriples/> <http://purl.org/dc/elements/1.1/publisher> <http://www.w3.org/> .
    


    N-ล่าม

    • ขยายอเนกประสงค์-N กับบริบท
    <subject> <predicate> <object> <context> .
    
    • <context> ส่ว​​นใหญ่มักจะหมายถึง (ในรัฐ-of-the-Art ร้านค้า RDF) ที่มาของข้อมูล
      • ชุดข้อมูลเมื่อเชื่อมโยงที่มีประโยชน์
    <http://example.org/bob/foaf.rdf#me> <http://xmlns.com/foaf/0.1/homepage>              <http://example.org/bob/> <http://example.org/bob/foaf.rdf> .
    
    • <context> อาจประกอบด้วย URI หรือ nodeID หรือตัวอักษร


    ทำไมหนึ่ง (ไม่) ควรใช้ XML สำหรับ RDF?

    ทำไม

    • การสนับสนุนที่ดีของเครื่องมือในหลายภาษาโปรแกรมและสภาพแวดล้อม
    • การแพร่กระจายกว้างของ XML ในธุรกิจและสถาบันการศึกษา
    • RDF รัฐมาตรฐานว่าถ้า RDF ข้อมูลที่มีการเผยแพร่ที่ควรจะมีอยู่ใน RDF / XML

    ทำไมไม่?

    • RDF / XML มีความซับซ้อนที่จะเข้าใจเพราะการเข้ารหัสของกราฟอเนกประสงค์และในที่สุดต้นไม้ XML
    • RDF / XML พัดไฟล์ (อาจจะลดลงโดยการบีบอัด)
    • สร้างค่าใช้จ่ายมากเพราะเอกสาร XML จะต้องมีการแยกวิเคราะห์และผลการดำเนินการนอกจากนี้ยังจะได้รับข้อมูล RDF