情報源と信頼性 — エビデンスの階層
査読論文(Level A)、公式ドキュメント(Level B)、実践知(Level C)。信頼性を3層に分類し、鮮度と併記する。
読了 約6分
最終更新 2026.05
生成AIは日進月歩で発展しており、情報の 鮮度 と 信頼性 はしばしば逆相関します。新しい知見ほど検証が追いついておらず、検証を経た知見ほど発表から時間が経っている——本サイトでは各情報源を信頼性によって三層に分類し、鮮度(年)と併記します。どちらが「上」ということではなく、目的に応じて使い分けることが重要です。
Level A
検証済み
査読付き論文・確立した理論。再現性と検証を経ており信頼性が高い。一方で、発表から時間が経ち、最新の実装や挙動を反映しないことがある。
Level B
一次情報
モデル提供元による公式ドキュメント・技術報告・システムカード。査読はされないが、対象製品については最も権威ある一次情報。比較的新しい。
Level C
実践知
開発者ブログ・技術記事・SNS(X等)・フォーラムの個人検証。現場の最新知見をいち早く含むが、再現性・一般性は未保証で、各自の検証が前提となる。
情報源カタログ
下のバッジで信頼性レベルを、右肩の数値で鮮度(年)を示します。
- A2020Brown, T. B., Mann, B., Ryder, N., et al. Language Models are Few-Shot Learners. NeurIPS 2020. arXiv:2005.14165
- A2022Wei, J., Wang, X., Schuurmans, D., et al. Chain-of-Thought Prompting Elicits Reasoning in Large Language Models. NeurIPS 2022. arXiv:2201.11903
- A2022Kojima, T., Gu, S. S., Reid, M., Matsuo, Y., & Iwasawa, Y. Large Language Models are Zero-Shot Reasoners. NeurIPS 2022. arXiv:2205.11916
- A2022Wang, X., Wei, J., Schuurmans, D., et al. Self-Consistency Improves Chain of Thought Reasoning in Language Models. arXiv:2203.11171
- A2023Yao, S., Yu, D., Zhao, J., et al. Tree of Thoughts: Deliberate Problem Solving with Large Language Models. NeurIPS 2023. arXiv:2305.10601
- A2022Yao, S., Zhao, J., Yu, D., et al. ReAct: Synergizing Reasoning and Acting in Language Models. ICLR 2023. arXiv:2210.03629
- A2020Lewis, P., Perez, E., Piktus, A., et al. Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. NeurIPS 2020. arXiv:2005.11401
- A2023Madaan, A., Tandon, N., Gupta, P., et al. Self-Refine: Iterative Refinement with Self-Feedback. NeurIPS 2023. arXiv:2303.17651
- A2023Shinn, N., Cassano, F., Gopinath, A., Narasimhan, K., & Yao, S. Reflexion: Language Agents with Verbal Reinforcement Learning. NeurIPS 2023. arXiv:2303.11366
- A2023Liu, N. F., Lin, K., Hewitt, J., et al. Lost in the Middle: How Language Models Use Long Contexts. TACL. arXiv:2307.03172
- A2025Meincke, L., et al. Prompting Science Report 2: The Decreasing Value of Chain of Thought in Prompting. arXiv:2506.07142
- A2017Vaswani, A., et al. Attention Is All You Need. NeurIPS 2017. arXiv:1706.03762
- A2014Goodfellow, I., et al. Generative Adversarial Networks. NeurIPS 2014. arXiv:1406.2661
- A2013Kingma, D. P., & Welling, M. Auto-Encoding Variational Bayes. arXiv:1312.6114
- A2018Devlin, J., et al. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. arXiv:1810.04805
- A2020Ho, J., Jain, A., & Abbeel, P. Denoising Diffusion Probabilistic Models. NeurIPS 2020. arXiv:2006.11239
- A2022Rombach, R., et al. High-Resolution Image Synthesis with Latent Diffusion Models. CVPR 2022. arXiv:2112.10752
- B2026Anthropic. Prompt engineering — Overview / Prompting best practices. 公式ドキュメント(継続更新)。docs.anthropic.com
- B2026OpenAI. Prompt engineering / Best practices. 公式ドキュメント(継続更新)。platform.openai.com
- C随時実践知(カテゴリ):開発者ブログ・技術記事・X等のSNS・フォーラムでの個人検証。最新の現場知見を素早く反映するが、出典と再現性は個別に確認が必要。特定の投稿を権威として扱わず、複数の情報源で裏取りすることが望ましい。