วิธีการตั้งค่าการเชื่อมโยง

  • ด้วยมือ
    • Uriqr หรือ Sindice เพื่อค้นหา URI ที่มีอยู่
  • รุ่นอัตโนมัติ
    • การค้นพบการเชื่อมโยง
      • มะนาว - กรอบการค้นพบการเชื่อมโยงสำหรับชี้วัดช่องว่างให้แนวทางเวลาที่มีประสิทธิภาพสำหรับการค้นพบและการคำนวณผลของคุณสมบัติการเชื่อมโยง
      • ผ้าไหม - กรอบการค้นพบการเชื่อมโยงสำหรับเว็บของเครื่องมือข้อมูลสำหรับการค้นพบความสัมพันธ์ระหว่างรายการข้อมูลภายในที่แตกต่างกันมีการเชื่อมโยงแหล่งข้อมูลที่ เผยแพร่ข้อมูลที่สามารถใช้ผ้าไหมในการตั้งค่าการเชื่อมโยง RDF จากแหล่งข้อมูลของพวกเขาไปยังแหล่งข้อมูลอื่น ๆ บนเว็บ
      • TopBraid นักแต่งเพลง (เอดิเตอร์อภิปรัชญาทำโดย TopQuadrant) มีตัวช่วยสำหรับการเชื่อมโยงกรณีอภิปรัชญากับแนวคิด DBpedia ที่สอดคล้องกัน
      • SemMF SemMF เป็นกรอบสำหรับการคำนวณความคล้ายคลึงกันระหว่างความหมายของวัตถุที่แสดงเป็นกราฟ RDF โดยพลการ กรอบจะช่วยให้การจัดหมวดหมู่และแนวคิดที่ไม่ได้จัดหมวดหมู่เทคนิคการจับคู่เพื่อนำไปใช้กับคุณสมบัติของวัตถุที่เลือก
      • Yves สมดุลขุดแร่ควบคู่กับรายงานของประสบการณ์เกี่ยวกับปัญหาที่เขาวิ่งเข้าไปในขณะที่ interlinking Jamendo และ MusicBrainz

การค้นพบการเชื่อมโยง

  • ไม่สามารถดำเนินการด้วยตนเองในระดับเว็บ
    • 31000000000 อเนกประสงค์
    • freebase มีกว่า 20 ล้านหน่วย
    • กว่า 250 ฐานความรู้
  • วิธีการอัตโนมัติ
    • อภิปรัชญา Matching
    • เช่นการจับคู่

อภิปรัชญา Matching

  • เป้าหมาย: หาการแสดงออกในชั้นเรียนนกฮูกที่แสดงความสัมพันธ์ระหว่างจีส์

OM: แนวทาง

  • ความรู้สึกตามระยะลำดับชั้น WordNet

OM: แนวทาง

  • เทคนิค extensional: เปรียบเทียบกรณี

OM: แนวทาง

  • ชุดข้อมูลขนาดเล็กที่มักจะในกรณีที่ตรงกัน
  • สำหรับอภิปรัชญาพอเพียงการจับคู่ที่ง่ายที่สุด
  • ปัญหา: ความแม่นยำในการหางยาว
  • Need for งบที่ถูกต้องอย่างเป็นทางการ (งบ DL)

การค้นพบการเชื่อมโยง

  • เป้าหมาย: ค้นพบหน่วยงานที่เกี่ยวข้องทั่วทั้งฐานความรู้

สิ่งที่ต้องทำ: Bild .. นิยามอย่างเป็นทางการ

  • เป้าหมาย: สำหรับทุก s  S และ T  T หาทุกคู่ (s, t) ดังกล่าวว่า s (s, t)> Q
  • สูตรเทียบเท่าค้นหาลักษณนาม C: S × T  {-1, 1} เช่นว่า C (s, t) = -1 IFF s (s, t) <Q อื่น C (s, t) = 1

การค้นพบการเชื่อมโยง

  • สอง หลัก ปัญหา
    • Runtime
    • ความซับซ้อนของข้อกำหนด
  • Runtime
    • จำนวนมากของกรณีที่
    • วิธีการโง่ใน O (| S | | T |)
    • การเปรียบเทียบสตริงที่ประกอบไปด้วยราชสกุลเมตรใน O (m2)

การค้นพบการเชื่อมโยง

  • สอง หลัก ปัญหา
    • Runtime
    • ความซับซ้อนของข้อกำหนด
  • ความซับซ้อน ของ ข้อกำหนด
    • คุณสมบัติที่ควรจะใช้?
    • ซึ่งมาตรการที่คล้ายคลึงกันทำงานได้ดีที่สุด?
    • ซึ่งการตั้งค่าเกณฑ์ที่ควรจะใช้?

การค้นพบการเชื่อมโยง

LD: Runtime

  • Aggregration และปิดกั้น (ไหม)

LD: Runtime

  • Aggregration และปิดกั้น (ไหม)

สิ่งที่ต้องทำ: Bild .. LD: Runtime

  • ไฮบริด (มะนาว)

LD: Runtime

  • PassJoin

สิ่งที่ต้องทำ: Bild .. Hyppo

  • D = T / A

สิ่งที่ต้องทำ: Bild .. Hyppo

Hyppo

Hyppo

  • D

Hyppo

  • D

Hyppo

  • อัตราประมาณ:
  • จำนวน ของ ก้อน:
  • tradeoff: เมล็ดสูงจะนำไปสู่การประมาณที่ดีขึ้น แต่เพื่อให้ก้อนอื่น ๆ
  • = 1
  • = 2
  • = 4

การเรียนรู้ที่จำเพาะต่อ

  • เรียนรู้การดูแล
    • การเรียนรู้ชุด
    • เรียนรู้การใช้งานล่าสุด
  • เรียนรู้แบบใกล้ชิด
    • การกำหนดค่าด้วยตนเอง
    • การเพิ่มประสิทธิภาพของฟังก์ชันวัตถุประสงค์

RAVEN

  • โรงพยาบาล / ผู้อยู่อาศัย
  • การเรียนรู้ลักษณนาม C เกี่ยวข้องกับการเรียนรู้
  • สองชุดของข้อ จำกัด ในการรับผิดชอบ ที่ระบุความรับผิดชอบชุด S T,
  • ข้อกำหนดของการวัดความคล้ายคลึงกันที่ซับซ้อนσที่เป็นส่วนผสมของความคล้ายคลึงกันของอะตอมหลายมาตรการσ1, ... , σnและ
  • ชุดของน้ำหนัก / q1 เกณฑ์ ... Qn ดังกล่าวว่าฉีเป็นเกณฑ์สำหรับσi

RAVEN

  • ผู้อยู่อาศัย / โรงพยาบาล + รุ่นลักษณนาม
  • การเรียนรู้ลักษณนาม C เกี่ยวข้องกับการเรียนรู้
  • สองชุดของข้อ จำกัด ในการรับผิดชอบ ที่ระบุความรับผิดชอบชุด S T,
  • ข้อกำหนดของการวัดความคล้ายคลึงกันที่ซับซ้อนσที่เป็นส่วนผสมของความคล้ายคลึงกันของอะตอมหลายมาตรการσ1, ... , σnและ
  • ชุดของน้ำหนัก / q1 เกณฑ์ ... Qn ดังกล่าวว่าฉีเป็นเกณฑ์สำหรับσi

RAVEN

  • ใช้งานล่าสุดรู้ Perceptron
  • การเรียนรู้ลักษณนาม C เกี่ยวข้องกับการเรียนรู้
  • สองชุดของข้อ จำกัด ในการรับผิดชอบ ที่ระบุความรับผิดชอบชุด S T,
  • ข้อกำหนดของการวัดความคล้ายคลึงกันที่ซับซ้อนσที่เป็นส่วนผสมของความคล้ายคลึงกันของอะตอมหลายมาตรการσ1, ... , σnและ
  • ชุดของน้ำหนัก / q1 เกณฑ์ ... Qn ดังกล่าวว่าฉีเป็นเกณฑ์สำหรับσi

RAVEN

RAVEN

RAVEN

RAVEN

โรงพยาบาล / ผู้อยู่อาศัย

โรงพยาบาล / ผู้อยู่อาศัย

สิ่งที่ต้องทำ: นิยาม

  • การเรียนรู้ลักษณนาม C เกี่ยวข้องกับการเรียนรู้
    1. สองชุดของข้อ จำกัด ในการรับผิดชอบ ที่ระบุความรับผิดชอบชุด S T,
    2. ข้อกำหนดของการวัดความคล้ายคลึงกันที่ซับซ้อนσที่เป็นส่วนผสมของความคล้ายคลึงกันของอะตอมหลายมาตรการσ1, ... , σnและ
    3. ชุดของเกณฑ์ q1, ... , Qn ดังกล่าวว่าฉีเป็นเกณฑ์สำหรับσi
  • หมายเหตุ: ข้อ จำกัด สมมติข้อ จำกัด ชั้น

การค้นพบข้อ จำกัด

1 เริ่มต้นด้วยแหล่งที่มาและเป้าหมายความรู้ฐานแคนซัสและ KT

การค้นพบข้อ จำกัด

2 กรณีตัวอย่างสุ่มข้ามแคนซัสและ KT

การค้นพบข้อ จำกัด

3 นับจำนวนของนกฮูก: เชื่อมโยงระหว่าง sameAs ศรีและ Tj

การค้นพบข้อ จำกัด

4 แก้ปัญหาโรงพยาบาลเทียบเท่า / เรสซิเดนปัญหา

การค้นพบข้อ จำกัด

4 แก้ปัญหาโรงพยาบาลเทียบเท่า / เรสซิเดนปัญหา

ปัญหา: ไม่พอนกฮูก: sameAs เชื่อมโยง

การค้นพบข้อ จำกัด

3 นับจำนวนของกรณีของ Si และ Tj ว่าส่วนแบ่งค่าทรัพย์สินส่วนกลาง

การค้นพบข้อ จำกัด

4 แก้ปัญหาโรงพยาบาลเทียบเท่า / เรสซิเดนปัญหา

การค้นพบข้อ จำกัด

  • แหล่ง

  • เป้า

  • S

  • T

  • DrugBank

  • Disesome

  • เป้าหมาย

  • ยีน

  • Sider

  • Diseasome

  • ผลข้างเคียง

  • โรค

  • DBpedia

  • Dailymed

  • องค์กร

  • องค์กร

  • Sider

  • Dailymed

  • ยาเสพติด

  • เสนอ

  • DrugBank

  • DBpedia

  • เป้าหมาย

  • โปรตีน

RAVEN

  • เริ่มต้นด้วยการเชื่อมโยงไม่เป็นความลับ

สิ่งที่ต้องทำ: Formel .. RAVEN

เริ่มต้นลักษณนาม:

สิ่งที่ต้องทำ: เครื่องหมาย .. RAVEN

  • รับผู้สมัครมากที่สุดข้อมูลบวก (L +) และลบ (L-)

RAVEN

  • ถาม oracle การจัดหมวดหมู่

RAVEN

  • ถาม oracle การจัดหมวดหมู่

สิ่งที่ต้องทำ: Formel .. RAVEN

  • ปรับปรุง L:

RAVEN

  • เรียกผู้สมัครในเชิงบวกและเชิงลบให้ข้อมูลมากที่สุด

RAVEN

  • ถาม oracle

สิ่งที่ต้องทำ: Formel .. RAVEN

  • ยุติเมื่อเห็นด้วยกับ oracle ทั้งหมดและกลับไปจัดหมวดหมู่

สิ่งที่ต้องทำ: Bild .. เป้าหมาย

  • DrugBank
  • Dailymed
  • ฐานข้อมูล: ยาเสพติด
  • rdfs: ฉลาก
  • DM: ชื่อ
  • ฐานข้อมูล: brandname
  • DM: ชื่อ
  • DM: ข้อเสนอ
  • trigrams
  • trigrams
  • > 0.9

สิ่งที่ต้องทำ: Bild .. EAGLE

  • Idea: ข้อมูลจำเพาะต้นไม้
  • เป้าหมาย: เรียนรู้องค์ประกอบของต้นไม้ผ่านการดำเนินงานทางพันธุกรรมจนสเปคที่ดีที่สุดคือพบว่า

สิ่งที่ต้องทำ: Bild .. EAGLE

  • ขั้นที่ 1: สร้างประชากรเริ่มต้น
    • กระบวนการสุ่ม (คู่ทรัพย์สินเกณฑ์)
    • คำนวณการออกกำลังกาย
    • ฟิตเนส = WRT F1 วัดข้อมูลที่รู้จักกัน

EAGLE

  • ขั้นที่ 2: Evolve ประชากร
    • การแข่งขันระหว่างบุคคลสองคน
    • สองผู้ประกอบการมิวเตชันและครอสโอเวอร์

EAGLE

  • ขั้นที่ 2: Evolve ประชากร
    • การแข่งขัน ระหว่าง สอง บุคคล
    • สองผู้ประกอบการมิวเตชันและครอสโอเวอร์

EAGLE

  • ขั้นที่ 2: Evolve ประชากร
    • การแข่งขัน ระหว่าง สอง บุคคล
    • สองผู้ประกอบการมิวเตชันและครอสโอเวอร์

EAGLE

  • ขั้นที่ 2: Evolve ประชากร
    • การแข่งขันระหว่างบุคคลสองคน
    • สองผู้ประกอบการมิวเตชันและครอสโอเวอร์

EAGLE

  • ขั้นที่ 2: Evolve ประชากร
      • การแข่งขันระหว่างบุคคลสองคน
    • สองผู้ประกอบการมิวเตชันและครอสโอเวอร์

EAGLE

  • ขั้นที่ 3: การคำนวณของการเชื่อมโยงข้อมูลมากที่สุด
    • แล้ววิธีการกำหนดปริมาณของข้อมูลของการเชื่อมโยงเป็นความใกล้ชิดกับขอบเขตการตัดสินใจ
    • ที่นี่ใช้ความขัดแย้งในหมู่องค์ประกอบของประชากรขนาด n
    • ฟังก์ชั่นเป็นสูงสุดเมื่อ n / 2 นับ (s, t) เป็นบวกและ n / 2 เป็นเชิงลบ
    • สามารถจำลองที่มีฟังก์ชั่นอื่น ๆ เช่นเอนโทรปี

สิ่งที่ต้องทำ: Bild .. EAGLE

  • ขั้นที่ 4: เรียนรู้การใช้งานล่าสุด
    • Compute d ((s, t)) สำหรับทุก (s, t) ส่งกลับโดยสเป็ค
    • เลือก k ที่ให้ข้อมูลมากที่สุด
    • จำเป็นต้องมีการติดฉลากจากผู้ใช้
    • ปรับปรุงรายการของตัวอย่างบวกและลบ

EAGLE

  • ขั้นที่ 5: ลบอย่างน้อยองค์ประกอบพอดี
  • ฟิตเนส = WRT F1 วัดข้อมูลที่รู้จักกัน

EAGLE

  • ขั้นที่ 5: ถ้าเงื่อนไขการเลิกจ้างไม่พบขั้นตอนที่ข้ามไป 2 อื่นยุติและเลือกข้อมูลจำเพาะ fittest

การดำเนินการ (มะนาว)

บทสรุป ...