Sora dilatih menggunakan data visual dalam jumlah besar, memungkinkannya mengambil pola untuk menghasilkan gambar dan video yang meniru kenyataan. Namun ia tidak dilatih untuk memahami hukum fisika seperti gravitasi.
“Tanpa pemahaman mendasar tentang dunia, model pada dasarnya hanyalah sebuah animasi, bukan simulasi,” kata Chen Yuntian, penulis studi dan profesor di Eastern Institute of Technology (EIT).
Model pembelajaran mendalam umumnya dilatih menggunakan data dan bukan pengetahuan sebelumnya, yang dapat mencakup hal-hal seperti hukum fisika atau logika matematika, menurut makalah tersebut.
Namun para ilmuwan dari Universitas Peking dan EIT menulis bahwa ketika melatih model, pengetahuan sebelumnya dapat digunakan bersama data untuk membuatnya lebih akurat, sehingga menciptakan model “pembelajaran mesin yang terinformasi” yang mampu menggabungkan pengetahuan ini ke dalam keluarannya.
Memutuskan pengetahuan sebelumnya – yang dapat mencakup hal-hal seperti hubungan fungsional, persamaan, dan logika – untuk dimasukkan ke dalam model untuk “dipelajari sebelumnya” merupakan sebuah tantangan dan menggabungkan banyak aturan juga dapat menyebabkan kegagalan model, tulis tim tersebut.
“Saat dihadapkan dengan banyaknya pengetahuan dan aturan – yang sering kali terjadi, model pembelajaran mesin yang terinformasi saat ini cenderung mengalami kesulitan atau bahkan gagal,” kata Chen.
Untuk mengatasi masalah ini, para peneliti membuat kerangka kerja untuk menilai nilai aturan dan menentukan kombinasi mana yang menghasilkan model paling prediktif.
“Menanamkan pengetahuan manusia ke dalam model AI berpotensi meningkatkan efisiensi dan kemampuan membuat kesimpulan, namun pertanyaannya adalah bagaimana menyeimbangkan pengaruh data dan pengetahuan,” kata Xu Hao, penulis pertama dan peneliti di Universitas Peking, dalam Cell Pernyataan pers.
“Kerangka kerja kami dapat digunakan untuk mengevaluasi berbagai pengetahuan dan aturan guna meningkatkan kemampuan prediktif model pembelajaran mendalam.”
Kerangka kerja tersebut menghitung “pentingnya aturan”, dengan melihat bagaimana aturan atau kombinasi atau aturan tertentu memengaruhi keakuratan prediksi suatu model, menurut makalah tersebut.
Mengajarkan model AI tentang aturan-aturan tersebut – misalnya, hukum fisika – dapat menjadikannya “lebih mencerminkan dunia nyata, yang akan membuatnya lebih berguna dalam sains dan teknik”, kata Chen dari EIT dalam pernyataannya.
Para peneliti menguji kerangka kerja mereka dengan menggunakannya untuk mengoptimalkan model untuk menyelesaikan persamaan multivariat, dan kerangka lain digunakan untuk memprediksi hasil percobaan kimia.
Chen mengatakan bahwa dalam jangka pendek kerangka kerja ini akan menjadi yang paling berguna dalam model ilmiah “di mana konsistensi antara model dan aturan fisika sangat penting untuk menghindari potensi konsekuensi bencana”.
Tim berharap untuk mengembangkan kerangka kerja mereka lebih jauh sehingga memungkinkan AI untuk mengidentifikasi pengetahuan dan aturannya sendiri langsung dari data tanpa campur tangan manusia.
“Kami ingin menjadikannya loop tertutup dengan menjadikan model tersebut menjadi ilmuwan AI sungguhan,” kata Chen dalam pernyataannya. Tim ini sedang mengembangkan alat plugin open source untuk pengembang AI yang memungkinkan mereka mencapai hal ini.
Namun, tim telah mengidentifikasi setidaknya satu masalah.
Selama penelitian, tim menemukan bahwa ketika lebih banyak data ditambahkan ke model, peraturan umum menjadi lebih penting dibandingkan peraturan lokal yang spesifik, namun hal ini tidak membantu dalam bidang seperti biologi dan kimia karena peraturan tersebut “sering kekurangan peraturan umum yang tersedia seperti halnya persamaan yang mengatur”.