Kursus → Modul 8: Pipeline
Sesi 10 dari 10

Tiga Hasil, Bukan Dua

Kebanyakan orang menganggap cek kualitas itu biner: lolos atau gagal. Itu ga cukup untuk production pipeline. Kamu butuh tiga hasil di setiap gate: lolos (maju ke tahap berikutnya), gagal (tolak sepenuhnya dan regenerate dari nol), dan rework (kembalikan ke tahap sebelumnya dengan koreksi spesifik).

Perbedaan antara gagal dan rework itu penting. Draft yang meleset total (topik salah, audiens salah, struktur berantakan) harus di-regenerate. Draft yang tulang-tulangnya benar tapi butuh koreksi voice dan fact-checking harus di-rework. Memperlakukan keduanya sama itu membuang waktu (rework sesuatu yang udah ga bisa diselamatkan) atau uang (regenerate sesuatu yang cuma butuh editing).

Menentukan Kriteria Sebelum Produksi

Kriteria kualitas harus ditentukan sebelum kamu mulai memproduksi, bukan diputuskan di saat itu. Kalau kamu capek jam 11 malam me-review draft kesepuluh, "cukup bagus deh" jadi sangat menggoda. Kriteria yang sudah ditentukan menghapus godaan itu. Kriteria bilang apa yang lolos dan apa yang ga. Mood kamu ga relevan.

flowchart TD A["Konten Tiba di Gate"] --> B{"Skor Berdasarkan Rubrik"} B -- "Skor 40+" --> C["LOLOS
Maju ke tahap berikutnya"] B -- "Skor 30-39" --> D["REWORK
Kembali dengan koreksi"] B -- "Skor di bawah 30" --> E["GAGAL
Regenerate dari nol"] D --> F["Tahap sebelumnya terapkan perbaikan"] F --> A E --> G["Mulai pipeline dari Stage 3"] G --> A style A fill:#222221,stroke:#c8a882,color:#ede9e3 style B fill:#222221,stroke:#8a8478,color:#ede9e3 style C fill:#222221,stroke:#6b8f71,color:#ede9e3 style D fill:#222221,stroke:#c47a5a,color:#ede9e3 style E fill:#222221,stroke:#c47a5a,color:#ede9e3 style F fill:#222221,stroke:#8a8478,color:#ede9e3 style G fill:#222221,stroke:#8a8478,color:#ede9e3

Rubrik Penilaian

Rubrik mengubah "ini terasa oke" yang subjektif jadi skor objektif. Lima dimensi, masing-masing skor 0 sampai 10, dengan total skor menentukan hasilnya.

Dimensi Skor 10 Skor 5 Skor 0
Akurasi faktual Setiap klaim terverifikasi, semua sumber disitasi, tanpa halusinasi Sebagian besar klaim akurat, 1-2 pernyataan belum terverifikasi Banyak fakta halusinasi, ga selaras dengan sumber
Konsistensi voice Ga bisa dibedakan dari konten yang ditulis tangan Sebagian besar on-voice, kadang pola AI terlihat Voice AI generik di seluruhnya, tanpa personality
Kejelasan struktur Kepatuhan outline sempurna, alur argumen jelas Sebagian besar ikut outline, satu bagian salah tempat Mengabaikan outline, ga ada argumen yang bisa dikenali
Orisinalitas insight Mengandung perspektif unik, pengetahuan praktisi, atau data original Pembahasan generik tapi kompeten Bisa ditulis tentang topik apa pun oleh AI mana pun
Ketiadaan AI artifact Nol artifact terdeteksi dalam 1000 kata 3-5 artifact minor (hedging, filler) Terbaca seperti output AI tanpa editing

Penempatan Gate

Ga semua tahap butuh quality gate rubrik penuh. Beberapa tahap butuh pengecekan ringan. Kuncinya mencocokkan intensitas gate dengan risiko di tahap itu.

Tahap Tipe Gate Yang Dicek Siapa yang Cek
1. Riset Cek kelengkapan Apakah brief menjawab semua pertanyaan riset? Apakah sumber di-rating? Manusia (scan cepat)
2. Outline Cek logika Apakah ketiga pertanyaan dasar punya jawaban? Apakah argumen mengalir? Manusia
3. Draft Cek struktural Apakah mengikuti outline? Dalam word count? Pendekatan voice? Otomatis + manusia
4. Review Rubrik penuh Semua 5 dimensi dinilai Manusia
5. Edit Cek resolusi masalah Semua anotasi review ditangani? Ga ada masalah baru? Manusia
6. Format Cek teknis Semua format dihasilkan? Metadata benar? Visual spot-check? Otomatis
7. Publish Checklist pra-publish Link, gambar, metadata, canonical URL, analytics Otomatis + manusia

Melacak Performa Gate

Setiap gate menghasilkan data. Lacak.

Data ini mengubah pipeline kamu dari sebuah proses jadi learning system. Setiap production run menghasilkan informasi tentang di mana pipeline kuat dan di mana lemah. Pakai informasi itu. Sesuaikan input. Perbaiki prompt. Perketat spesifikasi. Pipeline membaik seiring waktu, tapi cuma kalau kamu mengukurnya.

Quality gate tanpa kriteria yang jelas itu cuma opini. Quality gate dengan kriteria yang jelas, penilaian konsisten, dan metrik yang dilacak itu sistem. Sistem membaik. Opini bergeser.

Bacaan Lanjutan

Tugas

Buat rubrik kualitas untuk pipeline kamu:

  1. Tentukan 5 dimensi penilaian yang relevan dengan tipe konten kamu.
  2. Untuk setiap dimensi, jelaskan seperti apa skor 10, 5, dan 0.
  3. Tentukan threshold: total skor berapa yang berarti lolos, rework, atau gagal?
  4. Tes rubrik dengan menilai 3 konten (satu yang kamu tulis, satu output AI yang lumayan, satu yang jelas asal-asalan). Apakah skornya membedakan ketiganya dengan benar?

Format rubrik sebagai referensi satu halaman yang bisa dicetak. Sertakan threshold penilaian dan penempatan gate untuk tahap-tahap pipeline kamu. Dokumen ini jadi standar operasional untuk semua yang dihasilkan pipeline kamu.