Pelatihan RAG & Knowledge-Base Build untuk Aplikasi LLM untuk Sektor Pemerintahan & Sektor Publik
ASN di kementerian/lembaga menghadapi corpus peraturan yang sangat tebal: UU, PP, Perpres, Permen, Pergub, juklak, SOP. Menemukan peraturan terkini cepat adalah masalah nyata. RAG dapat mempercepat, tetapi sektor publik tunduk pada UU Keterbukaan Informasi Publik, UU PDP sektor publik, dan panduan BSSN. Klasifikasi informasi harus jadi langkah pertama; setiap jawaban harus dapat dilacak ke sumber asli; dan jejak penggunaan menjadi bukti tata kelola SPBE.
- format
- In-house / online / hybrid
- durasi
- 3-5 hari intensif atau program berkelanjutan 2-4 bulan
- peserta
- 8-20 per batch (engineer-grade)
- bahasa
- Indonesia / English
Mengapa Pelatihan RAG & Knowledge-Base Build untuk Aplikasi LLM berbeda di Pemerintahan & Sektor Publik
ASN di kementerian/lembaga menghadapi corpus peraturan yang sangat tebal: UU, PP, Perpres, Permen, Pergub, juklak, SOP. Menemukan peraturan terkini cepat adalah masalah nyata. RAG dapat mempercepat, tetapi sektor publik tunduk pada UU Keterbukaan Informasi Publik, UU PDP sektor publik, dan panduan BSSN. Klasifikasi informasi harus jadi langkah pertama; setiap jawaban harus dapat dilacak ke sumber asli; dan jejak penggunaan menjadi bukti tata kelola SPBE.
- Coverage peraturan aktif relevan di indeksMendekati 100% peraturan unit terindeks dengan klasifikasi
- Kontribusi pemakaian RAG terhadap evidence Indeks SPBETercatat sebagai bukti pemanfaatan TIK pada domain layanan SPBE
- Insiden jawaban tanpa citationMendekati nol setelah hardening system prompt
- Perpres 95/2018 SPBE
- PermenPANRB 3/2024 Indeks SPBE
- UU 14/2008 Keterbukaan Informasi Publik
- UU PDP No. 27/2022 — data warga & pemohon layanan
- Panduan Keamanan Informasi BSSN
- CIO / Kepala Pusat Data & Informasi
- Kepala Biro Hukum
- Kepala Bagian SDM ASN
- Inspektur Pembantu
- Lead AI/ML Engineer (mitra implementasi)
- Pejabat Pengelola Informasi & Dokumentasi (PPID)
- ASN menemukan peraturan terkini dengan citation pasal & tautan ke sumber resmi
- Klasifikasi informasi (terbuka/terbatas/rahasia) menjadi metadata wajib per chunk
- Vector store ditempatkan di Pusat Data Nasional / private cloud sesuai panduan BSSN
- Jejak pemakaian tersimpan untuk pemeriksaan inspektorat dan permintaan KIP
- Pimpinan satker memiliki kerangka risiko RAG yang dapat dilaporkan internal
Jawaban Singkat
Pelatihan RAG korporat adalah program engineering yang membangun retrieval-augmented generation end-to-end di atas corpus perusahaan: chunking, embedding, vector DB (Pinecone/Weaviate/Qdrant/pgvector), orkestrasi LangChain/LlamaIndex, evaluasi RAGAS & TruLens, plus hardening OWASP LLM Top 10 2025, NIST AI RMF GenAI Profile, dan UU PDP.
Tanpa evaluasi terstruktur, RAG hanya 'rasa benar'
Demo RAG tampak meyakinkan; produksi RAG menuntut bukti. Golden eval set, RAGAS faithfulness/context precision, dan regression test sebelum release adalah dasar agar perubahan retriever atau prompt tidak diam-diam menurunkan kualitas. Program ini memasang fondasi evaluasi sejak hari pertama.
Keamanan dipetakan ke OWASP LLM Top 10 2025
Modul keamanan dipetakan eksplisit ke OWASP LLM01 prompt injection, LLM06 sensitive information disclosure, LLM08 vector & embedding weaknesses, dan LLM09 misinformation, plus NIST AI RMF GenAI Profile (NIST AI 600-1) dan UU PDP.
Kesalahan paling umum: melompat ke vector DB tanpa chunking & evaluasi
Banyak tim sibuk memilih vector database lalu kecewa karena kualitas jawaban tetap rendah. Chunking yang tepat, embedding yang cocok corpus, dan golden eval set lebih menentukan dibanding pilihan DB. Program ini menempatkan prioritas pada urutan yang benar.
Pelatihan RAG & Knowledge-Base Build untuk Aplikasi LLM
Pelatihan RAG korporat adalah program teknis yang membekali tim engineering, data, dan produk membangun retrieval-augmented generation untuk aplikasi LLM perusahaan, dari strategi chunking dokumen, pemilihan embedding model, indeks pada vector database (Pinecone, Weaviate, Qdrant, pgvector), orkestrasi LangChain/LlamaIndex, sampai evaluasi kualitas dengan RAGAS dan TruLens, dengan kontrol risiko yang dipetakan ke OWASP LLM Top 10 2025, NIST AI RMF GenAI Profile (NIST AI 600-1), dan kewajiban UU PDP No. 27/2022.
Hasil Terukur
Hasil yang Diharapkan
Indikator dipetakan ke Kirkpatrick L1-L4; target kualitatif yang ditetapkan bersama saat TNA, tanpa janji angka yang tidak dapat dibuktikan.
- Pemahaman arsitektur RAG (Kirkpatrick L2, Learning)
- Seluruh peserta lulus asesmen konsep retrieve→augment→generate, chunking strategy, dan trade-off embedding model
- Prototipe RAG terkirim (L3, Behavior)
- Tiap kelompok kerja menghasilkan 1 prototipe RAG fungsional di akhir intensif, terintegrasi corpus perusahaan
- Kualitas jawaban (L4, Results)
- Skor RAGAS faithfulness & context precision di atas baseline yang ditetapkan tim, terukur pada golden eval set
- Guardrail keamanan (L2)
- Peserta lulus checklist OWASP LLM Top 10 2025 untuk arsitektur RAG yang dibangun
- Blueprint produksi (transfer L3)
- Dokumentasi deployment, observability (TruLens/Langfuse), dan SOP refresh index disetujui IT/keamanan
- ROI berbasis use case (Phillips L5, opsional)
- Perhitungan net benefit per use case yang diisolasi dari faktor lain, bila keuangan meminta
Format Program
Pilihan Format Program
Dipilih sesuai kematangan tim, kompleksitas corpus, dan target deployment, final ditetapkan setelah TNA.
RAG Use Case Sprint (2 hari)
Sprint terfokus membangun satu prototipe RAG di atas corpus internal nyata: scoping pertanyaan target, chunking awal, indeks, dan evaluasi tahap pertama dengan RAGAS.
RAG Engineering Intensive (4-5 hari)
Pendalaman lengkap: chunking lanjutan, hybrid search (BM25 + dense), reranker, multi-vector retrieval, evaluasi RAGAS + TruLens, observability, dan hardening OWASP LLM.
RAG Bootcamp Modular (6-8 sesi)
Sesi mingguan dengan jeda eksperimen di antaranya: peserta mempraktikkan, membawa hasil, dan dikoreksi sebelum sesi berikutnya. Cocok untuk tim yang tidak bisa lepas operasional.
RAG Maturity Program (3-4 bulan)
Program berkelanjutan dengan office hours, code review, dan checkpoint maturity per kuartal, sampai RAG masuk produksi dengan SLA dan dashboard observability terpelihara.
Konsultasi Gratis
Bangun RAG produksi dengan tim engineering Anda
Mulai dari training needs analysis gratis: kami petakan corpus, kematangan tim, dan target deployment, lalu susun proposal & estimasi biaya berbasis kebutuhan nyata.
Kurikulum
Kerangka Kurikulum
Disusun dengan ADDIE; modul final dikurasi sesuai hasil TNA. Cakupan di bawah adalah penuh, bisa diaktifkan sebagian sesuai kematangan tim.
Perbandingan
Memilih Format Program RAG
Matriks keputusan ringkas, final ditetapkan setelah training needs analysis.
| Aspek | RAG Use Case Sprint (2 hari) | RAG Engineering Intensive (4-5 hari) | RAG Bootcamp Modular (6-8 sesi) | RAG Maturity Program (3-4 bln) |
|---|---|---|---|---|
| Tujuan utama | Validasi 1 use case | Kapabilitas teknis penuh | Belajar paralel operasional | Produksi dengan SLA |
| Peserta ideal | Tim ML kecil dgn case konkret | Engineering team menengah-besar | Tim engineering operasional | Beberapa tim lintas use case |
| Kedalaman evaluasi | RAGAS dasar | RAGAS + TruLens + observability | RAGAS + iterasi eksperimen | Full eval + regression CI/CD |
| Level evaluasi training | Kirkpatrick L1-L2 | Kirkpatrick L1-L3 | Kirkpatrick L1-L3 | Kirkpatrick L1-L4 (+Phillips L5) |
| Paling cocok untuk | Cek viabilitas sebelum invest | Tim yang ingin produksi cepat | Tim padat operasional | Target deployment lintas use case |
Untuk Siapa
Untuk Siapa Program Ini?
Engineer-grade, peserta diasumsikan dasar Python & API LLM. TNA memetakan baseline agar konten relevan.
ML/AI Engineer & Data Scientist
Membangun pipeline RAG end-to-end dari ingestion sampai evaluasi observable di produksi.
Tantangan umum
- Prototipe RAG bagus di notebook, drop kualitasnya di corpus nyata
- Tidak tahu cara mengukur kualitas RAG selain 'feels right'
- Pilihan vector DB & embedding sekedar mengikuti tutorial, tanpa kriteria sendiri
Software Engineer & Platform Engineer
Mengintegrasikan RAG ke aplikasi internal, mengurus deployment, observability, dan SLA.
Tantangan umum
- Latency RAG tidak terkendali, biaya API LLM bocor
- Tidak ada CI/CD untuk perubahan prompt & retriever
- Audit log & citation belum cukup untuk review keamanan
Product Manager AI / Tech Lead
Memilih use case RAG yang layak, menetapkan kriteria kualitas, dan menyeimbangkan biaya vs nilai.
Tantangan umum
- Sulit menilai use case mana yang cocok RAG vs prompt-only vs fine-tuning
- Tidak punya kerangka evaluasi yang dapat dipresentasikan ke pimpinan
- Vendor lock-in pada satu framework/DB tanpa exit strategy
Tim Keamanan, Data Governance & Legal
Memastikan corpus, indeks, dan jawaban patuh kebijakan keamanan, data privacy, dan regulasi sektor.
Tantangan umum
- Vector store jadi shadow database tanpa klasifikasi data
- Tidak ada pemetaan ke OWASP LLM Top 10 2025 dan NIST AI RMF
- UU PDP, hak hapus & data minimisation belum diterjemahkan ke arsitektur RAG
Konteks Industri
Penerapan per Industri
Setiap industri punya corpus, regulasi, dan kriteria akurasi yang berbeda, RAG didesain mengikutinya.
Asisten internal untuk analis kredit & compliance yang menjawab dari dokumen kebijakan, POJK terkait, manual produk, dan memo komite, dengan citation wajib dan klasifikasi data per chunk.
Lihat di konteks Perbankan & Jasa Keuangan →Asisten dokumentasi & dev-portal untuk engineer: jawab dari dokumentasi internal, ADR, runbook, ticket Jira/Linear, dengan reranker, hybrid search, dan observability Langfuse/TruLens di produksi.
Lihat di konteks Teknologi & Startup →Asisten klinis pendukung keputusan (non-diagnostik) yang menjawab dari pedoman PPK, formularium rumah sakit, dan SOP, dengan citation, batas kasus, dan jejak audit untuk Komite Medik.
Lihat di konteks Kesehatan & Farmasi →Asisten kebijakan internal lintas anak perusahaan: jawab dari peraturan korporat, SOP, kebijakan AKHLAK turunan, dan rekomendasi audit, dengan jejak yang dapat diaudit BPK dan SPI.
Lihat di konteks BUMN →Asisten ASN untuk pencarian peraturan, kebijakan, dan surat dinas, dengan klasifikasi informasi (terbuka/terbatas/rahasia), citation wajib, dan jejak audit inspektorat.
Asisten akademik & layanan mahasiswa: jawab dari peraturan akademik, panduan kurikulum, FAQ layanan, dengan citation dan batas peran (tidak menggantikan dosen wali / akademik).
Lihat di konteks Pendidikan & Institusi Akademik →Metode Pengiriman
Cara Pelaksanaan
Pelatihan engineer-grade: praktik intensif dengan lab nyata, code review, dan rancang arsitektur, bukan ceramah konseptual.
In-house tatap muka
Fasilitator datang ke kantor; lab dijalankan di laptop peserta dengan corpus perusahaan (di lingkungan aman). Cocok untuk intensif 3-5 hari.
Live online
Kelas interaktif via Zoom/Teams dengan screen-share code review, breakout per tim use case, dan rekaman sesi. Cocok untuk bootcamp modular bertahap.
Hybrid
Sesi tatap muka untuk arsitektur & lab intensif, dilanjutkan office hours online untuk pengembangan prototipe dan code review berkelanjutan.
Alur Pelaksanaan
Alur Kerja Sama (Engagement Path)
Dari kebutuhan ke RAG produksi terukur, durasi kualitatif, disesuaikan skala.
Training Needs Analysis & Corpus Discovery
Pemetaan kematangan tim, kompleksitas corpus, regulasi sektor, dan target use case. Output: profil kebutuhan + baseline pengukuran + scoping use case pertama.
Tahap awalDesain Program (ADDIE)
Penyusunan tujuan pembelajaran, silabus engineering-grade, golden eval set draft, dan blueprint arsitektur referensi sesuai stack tim.
Sebelum deliveryDelivery, Lab Intensif
Hands-on lab: ingestion → chunking → embedding → indeks → retrieval → augmentation → generation. Tiap kelompok membawa corpus internal untuk use case nyata.
Inti programEvaluasi & Hardening
Pengukuran RAGAS/TruLens, hardening OWASP LLM Top 10 2025, pemetaan tata kelola (NIST AI RMF GenAI Profile, ISO/IEC 42001, UU PDP).
Setelah labOffice Hours & Pilot Produksi
Coaching pengembangan prototipe ke pilot produksi terbatas: observability Langfuse, SOP refresh index, audit log, CI/CD prompt & retriever.
Pasca-intensifEvaluasi Kirkpatrick & Roadmap Lanjutan
Laporan Level 1-3 (kehadiran, asesmen, perilaku/adopsi), opsi Level 4-5 bila pilot terukur, plus roadmap maturity per use case lanjutan.
Pasca programStudi Kasus
Pola Hasil Tipikal
Ilustrasi pola dampak dari struktur program serupa; tanpa nama klien atau angka yang dijanjikan.
Tim engineering perusahaan teknologi yang sudah punya prototipe RAG namun stuck di kualitas
Intervensi
Intensif 5 hari fokus chunking lanjutan, hybrid search, reranker, evaluasi RAGAS, observability Langfuse
Hasil
Skor faithfulness & context precision pada golden set meningkat dibanding baseline; tim memiliki regression test sebelum tiap release
Divisi data BUMN yang ingin asisten kebijakan internal lintas anak perusahaan
Intervensi
Program berkelanjutan 4 bulan + champion network engineer per anak perusahaan + tata kelola ISO/IEC 42001
Hasil
Beberapa pilot RAG masuk produksi terbatas dengan klasifikasi data dan audit log; SPI memiliki kertas kerja review yang siap pakai
Tim ML institusi keuangan yang baru memulai RAG
Intervensi
Workshop 2 hari + sprint use case pertama + pemetaan OWASP LLM Top 10 2025
Hasil
Satu prototipe RAG untuk kebijakan internal dengan citation berjalan; tim memiliki blueprint deployment yang disetujui IT risk
Informasi Pengadaan
Informasi untuk Procurement & Vendor Management
Kelengkapan untuk tim pengadaan, keuangan, hukum, dan keamanan informasi.
PT berbadan hukum di bawah ekosistem Selestia (Eduprima group); NPWP & dokumen legal lengkap; siap PKS/kontrak dan vendor onboarding.
Proposal teknis: tujuan pembelajaran terukur, silabus, peta keamanan (OWASP LLM/NIST AI RMF GenAI Profile/ISO 42001/UU PDP), profil fasilitator engineer, jadwal, rincian biaya berbasis TNA.
Berbasis TNA, flat per program, per sesi, per peserta, tiered, atau custom. Estimasi diberikan setelah TNA.
Termin fleksibel (DP + pelunasan / termin per batch); faktur pajak (PPN) dan dukungan dokumen PO tersedia.
Terbiasa pengadaan BUMN/instansi: dokumen vendor, e-procurement, HPS/penawaran, klausul kepatuhan SPBE.
Laporan evaluasi Kirkpatrick Level 1-3 (kehadiran, asesmen, hasil lab); Phillips ROI Level 5 atas permintaan keuangan.
NDA, klausul kerahasiaan, dan praktik lab yang tidak memaksa data rahasia masuk model publik (selaras OWASP LLM & UU PDP).
Notebook, golden eval set, dan blueprint yang dibangun untuk perusahaan menjadi milik perusahaan; hak pakai materi pelatihan disepakati di kontrak.
FAQ
Pertanyaan Umum
Langkah Berikutnya
Bangun RAG produksi dengan tim engineering Anda
Mulai dari training needs analysis gratis: kami petakan corpus, kematangan tim, dan target deployment, lalu susun proposal & estimasi biaya berbasis kebutuhan nyata.
- Training needs analysis tanpa biaya, langkah pertama yang natural
- Proposal, silabus, dan peta keamanan dalam beberapa hari kerja
- Dokumen siap procurement (company profile, NPWP, NDA, faktur PPN)
- Pengukuran dampak Kirkpatrick (Phillips ROI atas permintaan)
Pelatihan Pelatihan RAG & Knowledge-Base Build untuk Aplikasi LLM untuk tim Pemerintahan & Sektor Publik Anda
Mulai dari training needs analysis gratis: kami petakan corpus, kematangan tim, dan target deployment, lalu susun proposal & estimasi biaya berbasis kebutuhan nyata.
- Training needs analysis tanpa biaya, langkah pertama yang natural
- Proposal, silabus, dan peta keamanan dalam beberapa hari kerja
- Dokumen siap procurement (company profile, NPWP, NDA, faktur PPN)
- Pengukuran dampak Kirkpatrick (Phillips ROI atas permintaan)