اگر هر ماه تعداد زیادی فاکتور و رسید PDF از مشتریها، درگاههای پرداخت یا تأمینکنندهها دریافت میکنید، وارد کردن دستی اطلاعات در اکسل یا نرمافزار حسابداری هم وقتگیر است و هم مستعد خطاست. با یک ورکفلو هوش مصنوعی در n8n میتوانید این کار را خودکار کنید: PDF را آپلود کنید، سیستم به کمک OCR و LLM متن را میخواند، فیلدهای مهم (مبلغ، تاریخ، شماره فاکتور، طرف حساب و…) را استخراج میکند و همه چیز را مرتب در Airtable ذخیره میکند.
نتیجه این است که عملاً یک ربات ورود اطلاعات فاکتور دارید که بدون خستگی و اشتباه، اطلاعات مالی را برای شما ساختارمند میکند.
این ورکفلو دقیقاً چه کاری انجام میدهد؟
سناریوی «استخراج خودکار اطلاعات فاکتورهای PDF با هوش مصنوعی» در n8n این مراحل را پوشش میدهد:
- دریافت فایلهای PDF فاکتور یا رسید از ایمیل، پوشه ابری یا فرم آپلود،
- تبدیل تصویر/اسکن به متن با استفاده از OCR،
- ارسال متن به مدل زبانی (LLM) برای استخراج فیلدهای مالی مهم،
- ساخت یک رکورد استاندارد شامل شماره فاکتور، تاریخ، مبلغ، مالیات، ارز، فروشنده/خریدار و…،
- ذخیره خودکار این اطلاعات در Airtable یا دیتابیس مشابه،
- و در صورت نیاز، ارسال نوتیف برای تیم مالی یا حسابداری.
این روند را میتوانید برای رسیدهای خرید، فاکتورهای SaaS، صورتحسابهای تأمینکننده و حتی هزینههای سفر و ماموریت هم استفاده کنید.
سناریوهای کاربردی برای تیم مالی و استارتاپها
- استارتاپها و SaaS: خواندن خودکار فاکتورهای سرویسهای خارجی (مثل AWS، Stripe، ابزارهای مارکتینگ) و ثبت در یک دیتابیس مالی.
- فریلنسرها: ردیابی هزینهها و درآمدها از روی رسیدهای PDF و ساخت خلاصه ماهانه در Airtable.
- تیمهای حسابداری: سریعتر کردن ورود اطلاعات برای حجم زیاد فاکتورهای تکراری و استاندارد.
- مدیریت هزینههای شرکت: ثبت خودکار هزینههای کارمندان از روی رسیدهای اسکنی و ارسال گزارش برای مدیر.
جریان کلی این ورکفلو در n8n
از نگاه فنی، این ورکفلو معمولاً به چند مرحله مشخص تقسیم میشود:
-
۱. تریگر ورودی فاکتور:
شما میتوانید یکی از این روشها را برای شروع انتخاب کنید:
- خواندن خودکار ایمیلها (مثلاً یک آدرس مخصوص دریافت فاکتور) و گرفتن پیوستهای PDF،
- مانیتور کردن یک پوشه در Google Drive, Dropbox یا S3 برای فایلهای جدید،
- یا ساخت یک Webhook و فرم آپلود که کاربر فایل را مستقیم برای n8n ارسال کند.
- ۲. دریافت و آمادهسازی فایل PDF: فایل به صورت باینری در n8n دریافت میشود؛ نام فایل، فرستنده، تاریخ ایمیل یا مسیر ذخیره هم به عنوان متادیتا نگهداری میشود.
- ۳. اجرای OCR روی PDF: اگر فاکتور اسکنشده است، با یک سرویس OCR (مثل Google Vision, Tesseract, یا سرویسهای دیگر) متن استخراج میشود. در صورتی که PDF از نوع متنمحور باشد، میتوانید مستقیم متن را بدون OCR بخوانید.
- ۴. پاکسازی و نرمالسازی متن: با چند نود Set/Function، خطوط اضافی، فاصلهها و بخشهای نامربوط (مثل فوترهای تکراری) حذف میشوند تا ورودی LLM تمیزتر باشد.
-
۵. استخراج فیلدها با LLM (OpenAI):
متن تمیز به مدل OpenAI ارسال میشود همراه با Promptی که از مدل میخواهد:
- شماره فاکتور،
- تاریخ فاکتور،
- مبلغ نهایی، مالیات، ارز،
- نام مشتری/فروشنده،
- و هر فیلد دیگری که برای شما مهم است را به صورت JSON ساختارمند برگرداند.
- ۶. اعتبارسنجی و تبدیل مقادیر: در n8n میتوانید فرمت تاریخ را یکسان کنید، مبلغ را به عدد تبدیل کنید و در صورت خالی بودن فیلدهای مهم، فاکتور را به صف بررسی دستی بفرستید.
- ۷. ذخیره در Airtable: با نود Airtable یک رکورد جدید در جدول «Invoices» میسازید که ستونهایی مثل Invoice Number، Date، Total، Tax، Currency، Customer و لینک فایل PDF را پر میکند.
- ۸. اطلاعرسانی به تیم مالی: در صورت نیاز، با یک نود Gmail، Slack یا Telegram میتوانید به تیم مالی بگویید که «X فاکتور جدید ثبت شد» و لینک Airtable را بفرستید.
پیشنیازهای راهاندازی این ورکفلو
- اکانت Airtable: به همراه یک Base مالی و جدول Invoices با ستونهای مشخص.
- سرویس OCR: برای تبدیل PDFهای اسکنشده به متن (میتواند سرویس ابری یا موتور لوکال باشد).
- OpenAI API Key: یا مدل LLM سازگار برای تبدیل متن فاکتور به فیلدهای ساختارمند.
- منبع دریافت فاکتور: مثل Gmail، پوشه Google Drive، Dropbox یا فرم آپلود.
- n8n در حال اجرا: روی سرور شخصی، VPS، Docker یا n8n Cloud.
مراحل کلی پیادهسازی در n8n
- در Airtable یک جدول برای فاکتورها بسازید و ستونهای اصلی مانند شماره، تاریخ، مبلغ، ارز، طرف حساب و لینک فایل را تعریف کنید.
- در n8n یک ورکفلو جدید راهاندازی کنید که ورودی آن یا Gmail Trigger، یا Webhook، یا نود مرتبط با فضای ابری باشد.
- فایل PDF دریافتشده را با نود مناسب به سرویس OCR بفرستید و متن استخراجشده را تحویل بگیرید.
- متن را با نودهای Set/Function تمیز و کوتاه کنید (در صورت نیاز، فقط بخشهای مرتبط مانند جدول مبلغها را نگه دارید).
- نود OpenAI اضافه کنید و Promptی بنویسید که خروجی آن JSON شامل فیلدهای کلیدی فاکتور باشد.
- خروجی JSON را پارس کنید و مپ هر فیلد را به ستون مربوطه در Airtable تنظیم کنید.
- با نود Airtable → Create Record رکورد جدید را ایجاد و لینک فایل PDF را نیز ذخیره کنید.
- در صورت نیاز، نود ایمیل/تلگرام اضافه کنید تا وضعیت پردازش فاکتور را به تیم یا خودتان اطلاع دهد و در نهایت ورکفلو را فعال کنید.
چطور این ورکفلو را حرفهایتر کنیم؟
- حمایت از چند قالب فاکتور: در Prompt مشخص کنید که مدل باید با چند نوع قالب (داخلی، خارجی، فارسی، انگلیسی) کنار بیاید.
- تشخیص ارز و مالیات: از LLM بخواهید علاوه بر مبلغ نهایی، درصد و مقدار مالیات و نوع ارز (IRR, USD, EUR…) را هم جداگانه برگرداند.
- اتصال به نرمافزار حسابداری: بعد از Airtable، میتوانید دادهها را به سیستم حسابداری یا ERP خود هم Sync کنید.
- صف بررسی دستی: اگر اعتماد به OCR/LLM پایین باشد، رکوردهایی که فیلد ناقص دارند در یک «صف بررسی» قرار دهید تا ادمین تأیید کند.
- گزارشسازی: با اتصال Airtable به ابزارهای BI یا Google Data Studio، گزارشهای ماهانه هزینه/درآمد را خودکار بسازید.
نکات مهم و خطاهای رایج
- اگر OCR خروجی ضعیفی میدهد، کیفیت اسکن و رزولوشن PDF را بررسی کنید یا موتور OCR بهتری انتخاب کنید.
- برای جلوگیری از خطا، همیشه روی خروجی LLM یک لایه اعتبارسنجی بگذارید (مثلاً مبلغ منفی نباشد یا تاریخ غیرمنطقی ثبت نشود).
- بهخاطر هزینه OpenAI، میتوانید فقط روی فاکتورهای بالای یک مبلغ مشخص یا فقط روی PDFهایی با فرمت خاص LLM را اجرا کنید.
- اگر فاکتور چند صفحهای است، مطمئن شوید همه صفحات در OCR و تحلیل وارد شدهاند، نه فقط صفحه اول.
جمعبندی
ورکفلو استخراج خودکار اطلاعات فاکتورهای PDF با هوش مصنوعی در n8n و Airtable راهی عملی برای حذف ورود دستی اطلاعات و کاهش خطای انسانی است. فقط کافی است فاکتور را به سیستم بدهید؛ بقیه کار تشخیص متن، استخراج فیلدها و ثبت در دیتابیس مالی به صورت خودکار انجام میشود.
اگر میخواهید تیم مالیتان زمانش را بهجای تایپ اعداد، صرف تحلیل و تصمیمگیری کند، این سناریو یکی از بهترین استفادههای هوش مصنوعی و n8n در فرآیندهای حسابداری و مالی است.


