استخراج خودکار اطلاعات فاکتورهای PDF با هوش مصنوعی در n8n و Airtable

اگر هر ماه تعداد زیادی فاکتور و رسید PDF از مشتری‌ها، درگاه‌های پرداخت یا تأمین‌کننده‌ها دریافت می‌کنید، وارد کردن دستی اطلاعات در اکسل یا نرم‌افزار حسابداری هم وقت‌گیر است و هم مستعد خطاست. با یک ورک‌فلو هوش مصنوعی در n8n می‌توانید این کار را خودکار کنید: PDF را آپلود کنید، سیستم به کمک OCR و LLM متن را می‌خواند، فیلدهای مهم (مبلغ، تاریخ، شماره فاکتور، طرف حساب و…) را استخراج می‌کند و همه چیز را مرتب در Airtable ذخیره می‌کند.

نتیجه این است که عملاً یک ربات ورود اطلاعات فاکتور دارید که بدون خستگی و اشتباه، اطلاعات مالی را برای شما ساختارمند می‌کند.

این ورک‌فلو دقیقاً چه کاری انجام می‌دهد؟

سناریوی «استخراج خودکار اطلاعات فاکتورهای PDF با هوش مصنوعی» در n8n این مراحل را پوشش می‌دهد:

  • دریافت فایل‌های PDF فاکتور یا رسید از ایمیل، پوشه ابری یا فرم آپلود،
  • تبدیل تصویر/اسکن به متن با استفاده از OCR،
  • ارسال متن به مدل زبانی (LLM) برای استخراج فیلدهای مالی مهم،
  • ساخت یک رکورد استاندارد شامل شماره فاکتور، تاریخ، مبلغ، مالیات، ارز، فروشنده/خریدار و…،
  • ذخیره خودکار این اطلاعات در Airtable یا دیتابیس مشابه،
  • و در صورت نیاز، ارسال نوتیف برای تیم مالی یا حسابداری.

این روند را می‌توانید برای رسیدهای خرید، فاکتورهای SaaS، صورتحساب‌های تأمین‌کننده و حتی هزینه‌های سفر و ماموریت هم استفاده کنید.

سناریوهای کاربردی برای تیم مالی و استارتاپ‌ها

  • استارتاپ‌ها و SaaS: خواندن خودکار فاکتورهای سرویس‌های خارجی (مثل AWS، Stripe، ابزارهای مارکتینگ) و ثبت در یک دیتابیس مالی.
  • فریلنسرها: ردیابی هزینه‌ها و درآمدها از روی رسیدهای PDF و ساخت خلاصه ماهانه در Airtable.
  • تیم‌های حسابداری: سریع‌تر کردن ورود اطلاعات برای حجم زیاد فاکتورهای تکراری و استاندارد.
  • مدیریت هزینه‌های شرکت: ثبت خودکار هزینه‌های کارمندان از روی رسیدهای اسکنی و ارسال گزارش برای مدیر.

جریان کلی این ورک‌فلو در n8n

از نگاه فنی، این ورک‌فلو معمولاً به چند مرحله مشخص تقسیم می‌شود:

  • ۱. تریگر ورودی فاکتور: شما می‌توانید یکی از این روش‌ها را برای شروع انتخاب کنید:
    • خواندن خودکار ایمیل‌ها (مثلاً یک آدرس مخصوص دریافت فاکتور) و گرفتن پیوست‌های PDF،
    • مانیتور کردن یک پوشه در Google Drive, Dropbox یا S3 برای فایل‌های جدید،
    • یا ساخت یک Webhook و فرم آپلود که کاربر فایل را مستقیم برای n8n ارسال کند.
  • ۲. دریافت و آماده‌سازی فایل PDF: فایل به صورت باینری در n8n دریافت می‌شود؛ نام فایل، فرستنده، تاریخ ایمیل یا مسیر ذخیره هم به عنوان متادیتا نگهداری می‌شود.
  • ۳. اجرای OCR روی PDF: اگر فاکتور اسکن‌شده است، با یک سرویس OCR (مثل Google Vision, Tesseract, یا سرویس‌های دیگر) متن استخراج می‌شود. در صورتی که PDF از نوع متن‌محور باشد، می‌توانید مستقیم متن را بدون OCR بخوانید.
  • ۴. پاک‌سازی و نرمال‌سازی متن: با چند نود Set/Function، خطوط اضافی، فاصله‌ها و بخش‌های نامربوط (مثل فوترهای تکراری) حذف می‌شوند تا ورودی LLM تمیزتر باشد.
  • ۵. استخراج فیلدها با LLM (OpenAI): متن تمیز به مدل OpenAI ارسال می‌شود همراه با Promptی که از مدل می‌خواهد:
    • شماره فاکتور،
    • تاریخ فاکتور،
    • مبلغ نهایی، مالیات، ارز،
    • نام مشتری/فروشنده،
    • و هر فیلد دیگری که برای شما مهم است را به صورت JSON ساختارمند برگرداند.
  • ۶. اعتبارسنجی و تبدیل مقادیر: در n8n می‌توانید فرمت تاریخ را یکسان کنید، مبلغ را به عدد تبدیل کنید و در صورت خالی بودن فیلدهای مهم، فاکتور را به صف بررسی دستی بفرستید.
  • ۷. ذخیره در Airtable: با نود Airtable یک رکورد جدید در جدول «Invoices» می‌سازید که ستون‌هایی مثل Invoice Number، Date، Total، Tax، Currency، Customer و لینک فایل PDF را پر می‌کند.
  • ۸. اطلاع‌رسانی به تیم مالی: در صورت نیاز، با یک نود Gmail، Slack یا Telegram می‌توانید به تیم مالی بگویید که «X فاکتور جدید ثبت شد» و لینک Airtable را بفرستید.

پیش‌نیازهای راه‌اندازی این ورک‌فلو

  • اکانت Airtable: به همراه یک Base مالی و جدول Invoices با ستون‌های مشخص.
  • سرویس OCR: برای تبدیل PDFهای اسکن‌شده به متن (می‌تواند سرویس ابری یا موتور لوکال باشد).
  • OpenAI API Key: یا مدل LLM سازگار برای تبدیل متن فاکتور به فیلدهای ساختارمند.
  • منبع دریافت فاکتور: مثل Gmail، پوشه Google Drive، Dropbox یا فرم آپلود.
  • n8n در حال اجرا: روی سرور شخصی، VPS، Docker یا n8n Cloud.

مراحل کلی پیاده‌سازی در n8n

  1. در Airtable یک جدول برای فاکتورها بسازید و ستون‌های اصلی مانند شماره، تاریخ، مبلغ، ارز، طرف حساب و لینک فایل را تعریف کنید.
  2. در n8n یک ورک‌فلو جدید راه‌اندازی کنید که ورودی آن یا Gmail Trigger، یا Webhook، یا نود مرتبط با فضای ابری باشد.
  3. فایل PDF دریافت‌شده را با نود مناسب به سرویس OCR بفرستید و متن استخراج‌شده را تحویل بگیرید.
  4. متن را با نودهای Set/Function تمیز و کوتاه کنید (در صورت نیاز، فقط بخش‌های مرتبط مانند جدول مبلغ‌ها را نگه دارید).
  5. نود OpenAI اضافه کنید و Promptی بنویسید که خروجی آن JSON شامل فیلدهای کلیدی فاکتور باشد.
  6. خروجی JSON را پارس کنید و مپ هر فیلد را به ستون مربوطه در Airtable تنظیم کنید.
  7. با نود Airtable → Create Record رکورد جدید را ایجاد و لینک فایل PDF را نیز ذخیره کنید.
  8. در صورت نیاز، نود ایمیل/تلگرام اضافه کنید تا وضعیت پردازش فاکتور را به تیم یا خودتان اطلاع دهد و در نهایت ورک‌فلو را فعال کنید.

چطور این ورک‌فلو را حرفه‌ای‌تر کنیم؟

  • حمایت از چند قالب فاکتور: در Prompt مشخص کنید که مدل باید با چند نوع قالب (داخلی، خارجی، فارسی، انگلیسی) کنار بیاید.
  • تشخیص ارز و مالیات: از LLM بخواهید علاوه بر مبلغ نهایی، درصد و مقدار مالیات و نوع ارز (IRR, USD, EUR…) را هم جداگانه برگرداند.
  • اتصال به نرم‌افزار حسابداری: بعد از Airtable، می‌توانید داده‌ها را به سیستم حسابداری یا ERP خود هم Sync کنید.
  • صف بررسی دستی: اگر اعتماد به OCR/LLM پایین باشد، رکوردهایی که فیلد ناقص دارند در یک «صف بررسی» قرار دهید تا ادمین تأیید کند.
  • گزارش‌سازی: با اتصال Airtable به ابزارهای BI یا Google Data Studio، گزارش‌های ماهانه هزینه/درآمد را خودکار بسازید.

نکات مهم و خطاهای رایج

  • اگر OCR خروجی ضعیفی می‌دهد، کیفیت اسکن و رزولوشن PDF را بررسی کنید یا موتور OCR بهتری انتخاب کنید.
  • برای جلوگیری از خطا، همیشه روی خروجی LLM یک لایه اعتبارسنجی بگذارید (مثلاً مبلغ منفی نباشد یا تاریخ غیرمنطقی ثبت نشود).
  • به‌خاطر هزینه OpenAI، می‌توانید فقط روی فاکتورهای بالای یک مبلغ مشخص یا فقط روی PDFهایی با فرمت خاص LLM را اجرا کنید.
  • اگر فاکتور چند صفحه‌ای است، مطمئن شوید همه صفحات در OCR و تحلیل وارد شده‌اند، نه فقط صفحه اول.

جمع‌بندی

ورک‌فلو استخراج خودکار اطلاعات فاکتورهای PDF با هوش مصنوعی در n8n و Airtable راهی عملی برای حذف ورود دستی اطلاعات و کاهش خطای انسانی است. فقط کافی است فاکتور را به سیستم بدهید؛ بقیه کار تشخیص متن، استخراج فیلدها و ثبت در دیتابیس مالی به صورت خودکار انجام می‌شود.

اگر می‌خواهید تیم مالی‌تان زمانش را به‌جای تایپ اعداد، صرف تحلیل و تصمیم‌گیری کند، این سناریو یکی از بهترین استفاده‌های هوش مصنوعی و n8n در فرآیندهای حسابداری و مالی است.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.